====== 用例の出典 ====== 言語コーパスにおいて、データをどこから集めるかということは重要です。本コーパスは作例ではなく、すべて実例を収録しています。レトリックの用例の意味、構造、効果は多種多様で、コンテクストによって決まります。実例には出典があります。用例の出典にあたることができるようにすれば、コンテクストを必要な精度でたどることができます。 このページでは用例データの出典に関する、メタデータ(データについてのデータ)について述べています。 ===== メタデータ ===== ==== 枠組み ==== 用例には、コーパスの用例ID、ページタイプの他に、「作者」と「作品」、出典となる「文献」、およびその文献における位置(ページ数など)に関するメタデータが付与されています。メタデータは、できるだけ外部データベースとの連携を試みています。 === 作者 === * それぞれの作者は、国立国会図書館による典拠データベース『[[https://id.ndl.go.jp/auth/ndla/|Web NDL Authorities]]』のIDにひも付けられています。 * 生没年やジェンダーの情報を付与しています。これらにもとづいて、用例データの均衡性について考慮していく計画です。 * 可能であれば『[[https://ja.wikipedia.org/wiki/|Wikipedia]]』や『[[https://www.aozora.gr.jp/|青空文庫]]』へのリンクがあり、作者について簡易的に調べることができます。 * 作者ページから、文献、作品、用例ページをたどることができます。 === 作品 === 「作品」という単位は抽象的です。例えば文学作品は、何らかの文献のなかで出版されます。ある作品が複数の文献で出版されることがありますが、文学研究で問題になる細かい異同を考慮しなければ、それらは同一の作品だと考えることができます。 * それぞれの作品は、可能であれば、国立国会図書館による典拠データベース『[[https://id.ndl.go.jp/auth/ndla/|Web NDL Authorities]]』のIDにひも付けられています。(ただし、2024年現在データベース登録されているのは、著名な古典的作品のみにとどまっています。) * 初出年の情報を付与しています。年代に関する、用例データの均衡性について考慮していく計画です。 * それぞれの作品ページで、その作品から収録されているすべての用例をたどることができます。 === 文献 === * それぞれの文献は、国立国会図書館による書誌データベース『[[https://ndlsearch.ndl.go.jp/|国立国会図書館サーチ]]』を用いて「国立国会図書館書誌ID」にひも付けられています。 ==== 用例の分析 ==== 対象とする用例は、初出にかぎらず、アクセスしやすい媒体から自由に取っています。 現在収録されているのは、任意に選んだ作家の近代日本文学作品です。本文入力の労力を削減するために、『[[https://www.aozora.gr.jp/|青空文庫]]』に本文の電子テキストがあるものを選んでいます。したがって、用例の引用出典は「ちくま日本文学」シリーズに依っているが、本文の具体的表記については、基本的に青空文庫版となっており、揺れがありますのでご注意ください。 現在の用例は古い文学のみですが、新しい用例、文学以外のジャンルの用例を今後収録していく計画です。 ==== 例 ==== 例えば[[ex:a1096]]のメタデータは次の通りです。 * 作者:[[name:saka00065587]] * 作品:[[piece:saka000009277990-farc]] * 文献:[[reference:saka000009277990]] * ページ:57 ===== 作者一覧 ===== このコーパスの用例は、以下の作者の作品から引用されています。各作者のページでは、収録されている作品、文献、用例のリストをみることができます。 {{count>index:name}} {{topic>index:name}} ===== 作品一覧 ===== このコーパスの用例は、以下の作品から引用されています。各作品のページで、収録されている用例のリストをみることができます。 {{count>index:piece}} {{topic>index:piece}} ===== 文献一覧 ===== このコーパスの用例は、以下の文献から引用されています。各文献のページから、収録されている作品のリストをみることができます。 {{count>index:reference}} {{topic>index:reference}}