index:reference
差分
この文書の現在のバージョンと選択したバージョンの差分を表示します。
両方とも前のリビジョン 前のリビジョン 次のリビジョン | 前のリビジョン | ||
index:reference [2024/02/13 10:52] tk [用例の出典] |
index:reference [2024/02/13 11:27] (現在) tk [用例の分析] |
||
---|---|---|---|
ライン 1: | ライン 1: | ||
====== 用例の出典 ====== | ====== 用例の出典 ====== | ||
- | |||
- | |||
- | <WRAP center round important 60%> | ||
- | ※このページはアップデート作業中です。 | ||
- | </WRAP> | ||
言語コーパスにおいて、データをどこから集めるかということは重要です。本コーパスは作例ではなく、すべて実例を収録しています。レトリックの用例の意味、構造、効果は多種多様で、コンテクストによって決まります。実例には出典があります。用例の出典にあたることができるようにすれば、コンテクストを必要な精度でたどることができます。 | 言語コーパスにおいて、データをどこから集めるかということは重要です。本コーパスは作例ではなく、すべて実例を収録しています。レトリックの用例の意味、構造、効果は多種多様で、コンテクストによって決まります。実例には出典があります。用例の出典にあたることができるようにすれば、コンテクストを必要な精度でたどることができます。 | ||
- | このページでは用例データの出典に関する、メタデータ(データについてのデータ)のアノテーションについて述べています。 | + | このページでは用例データの出典に関する、メタデータ(データについてのデータ)について述べています。 |
- | ===== メタ情報アノテーション ===== | + | ===== メタデータ ===== |
==== 枠組み ==== | ==== 枠組み ==== | ||
- | 用例には、「作者」と「作品」、およびその作品における位置(ページ数など)に関するメタ情報が付与されています。各作品のページには、底本として使用した「参考文献」の情報が付与されています。 | + | 用例には、コーパスの用例ID、ページタイプの他に、「作者」と「作品」、出典となる「文献」、およびその文献における位置(ページ数など)に関するメタデータが付与されています。メタデータは、できるだけ外部データベースとの連携を試みています。 |
=== 作者 === | === 作者 === | ||
+ | * それぞれの作者は、国立国会図書館による典拠データベース『[[https://id.ndl.go.jp/auth/ndla/|Web NDL Authorities]]』のIDにひも付けられています。 | ||
+ | * 生没年やジェンダーの情報を付与しています。これらにもとづいて、用例データの均衡性について考慮していく計画です。 | ||
+ | * 可能であれば『[[https://ja.wikipedia.org/wiki/|Wikipedia]]』や『[[https://www.aozora.gr.jp/|青空文庫]]』へのリンクがあり、作者について簡易的に調べることができます。 | ||
+ | * 作者ページから、文献、作品、用例ページをたどることができます。 | ||
=== 作品 === | === 作品 === | ||
+ | 「作品」という単位は抽象的です。例えば文学作品は、何らかの文献のなかで出版されます。ある作品が複数の文献で出版されることがありますが、文学研究で問題になる細かい異同を考慮しなければ、それらは同一の作品だと考えることができます。 | ||
+ | |||
+ | * それぞれの作品は、可能であれば、国立国会図書館による典拠データベース『[[https://id.ndl.go.jp/auth/ndla/|Web NDL Authorities]]』のIDにひも付けられています。(ただし、2024年現在データベース登録されているのは、著名な古典的作品のみにとどまっています。) | ||
+ | * 初出年の情報を付与しています。年代に関する、用例データの均衡性について考慮していく計画です。 | ||
+ | * それぞれの作品ページで、その作品から収録されているすべての用例をたどることができます。 | ||
=== 文献 === | === 文献 === | ||
+ | * それぞれの文献は、国立国会図書館による書誌データベース『[[https://ndlsearch.ndl.go.jp/|国立国会図書館サーチ]]』を用いて「国立国会図書館書誌ID」にひも付けられています。 | ||
==== 用例の分析 ==== | ==== 用例の分析 ==== | ||
- | コーパス構築の第一ステップとして、古典的な文学作品には、代表的なレトリックが見つかりやすいと考え、[[http://www.chikumashobo.co.jp/special/nihonbungaku/|ちくま日本文学]]から、任意の作家を選抜した。収録された短編、または抜粋に関しては、網羅的な収集を試みた。ただし、本文入力の労力を削減するために、『[[https://www.aozora.gr.jp/|青空文庫]]』に本文の電子テキストがあるものを選んでいる。したがって、用例の引用出典は「ちくま日本文学」シリーズに依っているが、本文の具体的表記については、基本的に青空文庫版となっている。 | + | 対象とする用例は、初出にかぎらず、アクセスしやすい媒体から自由に取っています。 |
- | * 表記には揺れがあるため、表記の異同などが重要な問題となる文学的な考察に利用する場合には、底本を参照。 | + | 現在収録されているのは、任意に選んだ作家の近代日本文学作品です。本文入力の労力を削減するために、『[[https://www.aozora.gr.jp/|青空文庫]]』に本文の電子テキストがあるものを選んでいます。したがって、用例の引用出典は「ちくま日本文学」シリーズに依っているが、本文の具体的表記については、基本的に青空文庫版となっており、揺れがありますのでご注意ください。 |
- | * 字体は原則として、新字、新仮名遣いとしているが、一部旧仮名遣いのものがある。 | + | |
- | * ふりがなは丸括弧で表記し、自由に取捨した。 | + | 現在の用例は古い文学のみですが、新しい用例、文学以外のジャンルの用例を今後収録していく計画です。 |
==== 例 ==== | ==== 例 ==== | ||
+ | 例えば[[ex:a1096]]のメタデータは次の通りです。 | ||
+ | |||
+ | * 作者:[[name:saka00065587]] | ||
+ | * 作品:[[piece:saka000009277990-farc]] | ||
+ | * 文献:[[reference:saka000009277990]] | ||
+ | * ページ:57 | ||
===== 作者一覧 ===== | ===== 作者一覧 ===== |
最終更新: 2024/02/13 10:52