index:reference

差分

この文書の現在のバージョンと選択したバージョンの差分を表示します。

この比較画面にリンクする

両方とも前のリビジョン 前のリビジョン
次のリビジョン
前のリビジョン
index:reference [2024/02/02 09:27]
tk
index:reference [2024/02/13 11:27]
tk [用例の分析]
ライン 1: ライン 1:
 ====== 用例の出典 ====== ====== 用例の出典 ======
- 
- 
-<WRAP center round important 60%> 
-※このページはアップデート作業中です。 
-</​WRAP>​ 
  
 言語コーパスにおいて、データをどこから集めるかということは重要です。本コーパスは作例ではなく、すべて実例を収録しています。レトリックの用例の意味、構造、効果は多種多様で、コンテクストによって決まります。実例には出典があります。用例の出典にあたることができるようにすれば、コンテクストを必要な精度でたどることができます。 言語コーパスにおいて、データをどこから集めるかということは重要です。本コーパスは作例ではなく、すべて実例を収録しています。レトリックの用例の意味、構造、効果は多種多様で、コンテクストによって決まります。実例には出典があります。用例の出典にあたることができるようにすれば、コンテクストを必要な精度でたどることができます。
  
-このページでは用例の出典に関する、メタ情報(データについてのデータ)アノテーションについて述べています。+このページでは用例データの出典に関する、メタデータ(データについてのデータ)について述べています。
  
-===== メタ情報アノテション ​=====+===== メタタ =====
  
 ==== 枠組み ==== ==== 枠組み ====
  
-ベータ版構築あたり著作権が既に切れている日本近代文学から用例を収集した。これにより著作権処理問題を回避した。将来的、よりバランス取れたデータの収集を計画している(参考:[[info:​aboutus#​データの収集方針について|データの収集方針につい]])+用例コーパスの用例IDページタイプに、「作者」と「作品」、出典となる「文献」、おびそ文献における位置(ページ数など)に関するメタデータが付与されています。メタデータは、できるだけ外部データベースと連携を試みいます
  
-コーパス構築の第一ステップとして、古典的な文学品には、代表的なレトリックが見つかりやすいと考え、[[http://​www.chikumashobo.co.jp/​special/​nihonbungaku/​|ちくま日本文学]]から、任意の作家を選抜した。収録された短編、または抜粋に関しては、網羅的な収集を試みた。ただし、本文入力の労力を削減するために、『[[https://​www.aozora.gr.jp/​|青空文庫]]』に本文の電子テキストがあるものを選んでいる。したがって、用例の引用出典は「ちくま日本文学」シリーズに依っているが、本文の具体的表記については、基本的に青空文庫版となっている。+=== 者 ===
  
-  * 表記には揺があるため、表記異同などが重要な問題となる文学的な考察利用す場合は、底本を参照。 +  * それぞれの作者は、国立国会図書館典拠データベース『[[https://​id.ndl.go.jp/​auth/​ndla/​|Web NDL Authorities]]』のIDひも付けられています。 
-  * 字体は原則として、新字、新仮名遣いとしてるが一部旧仮名遣いのがある。 +  * 生没年やジェンダーの情報を付与しています。これらにも用例データ均衡性について考慮していく計画です。 
-  * ふりがなは丸括弧で表記し自由に取捨した。+  * 可能であれば『[[https://​ja.wikipedia.org/​wiki/​|Wikipedia]]』や『[[https://​www.aozora.gr.jp/​|青空文庫]]』へリンクがあり、作者について簡易的に調べことができます。 
 +  * 作者ページから文献、作品、用例ページをどることができます
  
 +=== 作品 ===
 +
 +「作品」という単位は抽象的です。例えば文学作品は、何らかの文献のなかで出版されます。ある作品が複数の文献で出版されることがありますが、文学研究で問題になる細かい異同を考慮しなければ、それらは同一の作品だと考えることができます。
 +
 +  * それぞれの作品は、可能であれば、国立国会図書館による典拠データベース『[[https://​id.ndl.go.jp/​auth/​ndla/​|Web NDL Authorities]]』のIDにひも付けられています。(ただし、2024年現在データベース登録されているのは、著名な古典的作品のみにとどまっています。)
 +  * 初出年の情報を付与しています。年代に関する、用例データの均衡性について考慮していく計画です。
 +  * それぞれの作品ページで、その作品から収録されているすべての用例をたどることができます。
 +
 +=== 文献 ===
 +
 +  * それぞれの文献は、国立国会図書館による書誌データベース『[[https://​ndlsearch.ndl.go.jp/​|国立国会図書館サーチ]]』を用いて「国立国会図書館書誌ID」にひも付けられています。
 ==== 用例の分析 ==== ==== 用例の分析 ====
  
-用例の分析+対象とする用例は、初出にかぎらず、アクセスしやすい媒体から自由に取っています。 
 + 
 +現在収録されているは、任意に選んだ作家の近代日本文学作品です。本文入力の労力を削減するために、『[[https://​www.aozora.gr.jp/​|青空文庫]]』に本文の電子テキストがあるものを選んでいます。したがって、用例の引用出典は「ちくま日本文学」シリーズに依っているが、本文の具体的表記については、基本的に青空文庫版となっており、揺れがありますのでご注意ください。 
 + 
 +現在の用例は古い文学のみですが、新しい用例、文学以外のジャンルの用例を今後収録していく計画です。
 ==== 例 ==== ==== 例 ====
  
-+えば[[ex:​a1096]]のメタデータは次の通りです。 
 + 
 +  * 作者:[[name:​saka00065587]] 
 +  * 作品:[[piece:​saka000009277990-farc]] 
 +  * 文献:[[reference:​saka000009277990]] 
 +  * ページ:57
  
 ===== 作者一覧 ===== ===== 作者一覧 =====
最終更新: 2024/02/13 11:27