index:reference

差分

この文書の現在のバージョンと選択したバージョンの差分を表示します。

この比較画面にリンクする

両方とも前のリビジョン 前のリビジョン
次のリビジョン
前のリビジョン
index:reference [2024/02/13 11:01]
tk [枠組み]
index:reference [2024/02/13 11:27] (現在)
tk [用例の分析]
ライン 1: ライン 1:
 ====== 用例の出典 ====== ====== 用例の出典 ======
- 
- 
-<WRAP center round important 60%> 
-※このページはアップデート作業中です。 
-</​WRAP>​ 
  
 言語コーパスにおいて、データをどこから集めるかということは重要です。本コーパスは作例ではなく、すべて実例を収録しています。レトリックの用例の意味、構造、効果は多種多様で、コンテクストによって決まります。実例には出典があります。用例の出典にあたることができるようにすれば、コンテクストを必要な精度でたどることができます。 言語コーパスにおいて、データをどこから集めるかということは重要です。本コーパスは作例ではなく、すべて実例を収録しています。レトリックの用例の意味、構造、効果は多種多様で、コンテクストによって決まります。実例には出典があります。用例の出典にあたることができるようにすれば、コンテクストを必要な精度でたどることができます。
  
-このページでは用例データの出典に関する、メタデータ(データについてのデータ)のアノテーションについて述べています。+このページでは用例データの出典に関する、メタデータ(データについてのデータ)について述べています。
  
-===== メタ情報アノテション ​=====+===== メタタ =====
  
 ==== 枠組み ==== ==== 枠組み ====
  
-用例には、「作者」と「作品」、およびその作品における位置(ページ数など)に関するメタデータが付与されています。各作品のペジには、底本して使用した「参考文献」情報が付与されています。+用例には、コーパスの用例ID、ページタイプの他に、「作者」と「作品」、出典となる「文献」、およびその文献における位置(ページ数など)に関するメタデータが付与されています。メタデは、できるだけ外部データベースとの連携を試みています。
  
 === 作者 === === 作者 ===
  
   * それぞれの作者は、国立国会図書館による典拠データベース『[[https://​id.ndl.go.jp/​auth/​ndla/​|Web NDL Authorities]]』のIDにひも付けられています。   * それぞれの作者は、国立国会図書館による典拠データベース『[[https://​id.ndl.go.jp/​auth/​ndla/​|Web NDL Authorities]]』のIDにひも付けられています。
-  * 生没年やジェンダーの情報を付与しています。これらにもとづいて、データの均衡性について考慮していく計画です。+  * 生没年やジェンダーの情報を付与しています。これらにもとづいて、用例データの均衡性について考慮していく計画です。
   * 可能であれば『[[https://​ja.wikipedia.org/​wiki/​|Wikipedia]]』や『[[https://​www.aozora.gr.jp/​|青空文庫]]』へのリンクがあり、作者について簡易的に調べることができます。   * 可能であれば『[[https://​ja.wikipedia.org/​wiki/​|Wikipedia]]』や『[[https://​www.aozora.gr.jp/​|青空文庫]]』へのリンクがあり、作者について簡易的に調べることができます。
   * 作者ページから、文献、作品、用例ページをたどることができます。   * 作者ページから、文献、作品、用例ページをたどることができます。
ライン 25: ライン 20:
 === 作品 === === 作品 ===
  
 +「作品」という単位は抽象的です。例えば文学作品は、何らかの文献のなかで出版されます。ある作品が複数の文献で出版されることがありますが、文学研究で問題になる細かい異同を考慮しなければ、それらは同一の作品だと考えることができます。
 +
 +  * それぞれの作品は、可能であれば、国立国会図書館による典拠データベース『[[https://​id.ndl.go.jp/​auth/​ndla/​|Web NDL Authorities]]』のIDにひも付けられています。(ただし、2024年現在データベース登録されているのは、著名な古典的作品のみにとどまっています。)
 +  * 初出年の情報を付与しています。年代に関する、用例データの均衡性について考慮していく計画です。
 +  * それぞれの作品ページで、その作品から収録されているすべての用例をたどることができます。
  
 === 文献 === === 文献 ===
  
 +  * それぞれの文献は、国立国会図書館による書誌データベース『[[https://​ndlsearch.ndl.go.jp/​|国立国会図書館サーチ]]』を用いて「国立国会図書館書誌ID」にひも付けられています。
 ==== 用例の分析 ==== ==== 用例の分析 ====
  
-コーパス構築の第一ステップして古典的な文学作品代表的なレトリッが見つかりやすいと考え、[[http://​www.chikumashobo.co.jp/​special/​nihonbungaku/​|ちくま日本文学]]から、任意の作家を選抜した。収録された短編、または抜粋関しは、網羅的な収集を試みた。ただし、本文入力の労力を削減するために、『[[https://​www.aozora.gr.jp/​|青空文庫]]』に本文の電子テキストがあるものを選んでる。したがって、用例の引用出典は「ちく日本文学」シリーズに依っているが、本文の具体的表記については、基本的に青空文庫版となっている+対象する用例は初出かぎらずセスしやすい媒体から自由取っていま
  
-  * 表記には揺があため表記異同などが重要な問題となる文学的な考察に利用する場合本を参照 +現在収録さていのは任意に選んだ作家近代日本文学作品です。本文入力の労力を削減するために、『[[https://​www.aozora.gr.jp/​|青空文庫]]』に文の電子テキストがあるもの選んでいます。したがって、用例の引用出典は「ちくま日本文学」シリーズに依っているが、本文具体的表記については、基本的に青空文庫版となっており、揺れがありますのでご注意ください。 
-  * 字体は原則として、新字、新仮名遣いとしているが、一部旧仮名遣いのものがあ。 + 
-  * ふりがな丸括弧表記し、自由に取捨+現在の用例古い文学のみすが、新い用例文学以外のジャンルの用例を今後収録ていく計画です
 ==== 例 ==== ==== 例 ====
  
 +例えば[[ex:​a1096]]のメタデータは次の通りです。
 +
 +  * 作者:[[name:​saka00065587]]
 +  * 作品:[[piece:​saka000009277990-farc]]
 +  * 文献:[[reference:​saka000009277990]]
 +  * ページ:57
  
 ===== 作者一覧 ===== ===== 作者一覧 =====
最終更新: 2024/02/13 11:01