index:reference

差分

この文書の現在のバージョンと選択したバージョンの差分を表示します。

この比較画面にリンクする

両方とも前のリビジョン 前のリビジョン
次のリビジョン
前のリビジョン
index:reference [2024/02/13 11:14]
tk [枠組み]
index:reference [2024/02/13 11:27] (現在)
tk [用例の分析]
ライン 1: ライン 1:
 ====== 用例の出典 ====== ====== 用例の出典 ======
- 
- 
-<WRAP center round important 60%> 
-※このページはアップデート作業中です。 
-</​WRAP>​ 
  
 言語コーパスにおいて、データをどこから集めるかということは重要です。本コーパスは作例ではなく、すべて実例を収録しています。レトリックの用例の意味、構造、効果は多種多様で、コンテクストによって決まります。実例には出典があります。用例の出典にあたることができるようにすれば、コンテクストを必要な精度でたどることができます。 言語コーパスにおいて、データをどこから集めるかということは重要です。本コーパスは作例ではなく、すべて実例を収録しています。レトリックの用例の意味、構造、効果は多種多様で、コンテクストによって決まります。実例には出典があります。用例の出典にあたることができるようにすれば、コンテクストを必要な精度でたどることができます。
  
-このページでは用例データの出典に関する、メタデータ(データについてのデータ)のアノテーションについて述べています。+このページでは用例データの出典に関する、メタデータ(データについてのデータ)について述べています。
  
-===== メタ情報アノテション ​=====+===== メタタ =====
  
 ==== 枠組み ==== ==== 枠組み ====
  
-用例には、「作者」と「作品」、およびその作品における位置(ページ数など)に関するメタデータが付与されています。メタデータは、できるだけ外部データベースとの連携を試みています。+用例には、コーパスの用例ID、ページタイプの他に、「作者」と「作品」、出典となる「文献」、およびその文献における位置(ページ数など)に関するメタデータが付与されています。メタデータは、できるだけ外部データベースとの連携を試みています。
  
 === 作者 === === 作者 ===
ライン 36: ライン 31:
 ==== 用例の分析 ==== ==== 用例の分析 ====
  
-コーパス構築の第一ステップして古典的な文学作品代表的なレトリッが見つかりやすいと考え、[[http://​www.chikumashobo.co.jp/​special/​nihonbungaku/​|ちくま日本文学]]から、任意の作家を選抜した。収録された短編、または抜粋関しは、網羅的な収集を試みた。ただし、本文入力の労力を削減するために、『[[https://​www.aozora.gr.jp/​|青空文庫]]』に本文の電子テキストがあるものを選んでる。したがって、用例の引用出典は「ちく日本文学」シリーズに依っているが、本文の具体的表記については、基本的に青空文庫版となっている+対象する用例は初出かぎらずセスしやすい媒体から自由取っていま
  
-  * 表記には揺があため表記異同などが重要な問題となる文学的な考察に利用する場合本を参照 +現在収録さていのは任意に選んだ作家近代日本文学作品です。本文入力の労力を削減するために、『[[https://​www.aozora.gr.jp/​|青空文庫]]』に文の電子テキストがあるもの選んでいます。したがって、用例の引用出典は「ちくま日本文学」シリーズに依っているが、本文具体的表記については、基本的に青空文庫版となっており、揺れがありますのでご注意ください。 
-  * 字体は原則として、新字、新仮名遣いとしているが、一部旧仮名遣いのものがあ。 + 
-  * ふりがな丸括弧表記し、自由に取捨+現在の用例古い文学のみすが、新い用例文学以外のジャンルの用例を今後収録ていく計画です
 ==== 例 ==== ==== 例 ====
  
 +例えば[[ex:​a1096]]のメタデータは次の通りです。
 +
 +  * 作者:[[name:​saka00065587]]
 +  * 作品:[[piece:​saka000009277990-farc]]
 +  * 文献:[[reference:​saka000009277990]]
 +  * ページ:57
  
 ===== 作者一覧 ===== ===== 作者一覧 =====
最終更新: 2024/02/13 11:14