info:aboutus

差分

この文書の現在のバージョンと選択したバージョンの差分を表示します。

この比較画面にリンクする

両方とも前のリビジョン 前のリビジョン
次のリビジョン
前のリビジョン
info:aboutus [2024/02/13 10:24]
tk [プロジェクト沿革]
info:aboutus [2024/03/20 17:36] (現在)
tk
ライン 1: ライン 1:
 ====== 『日本語レトリックコーパス』について ====== ====== 『日本語レトリックコーパス』について ======
  
-<WRAP center round important 60%> 
-※このページはアップデート作業中です。 
-</​WRAP>​ 
 ===== はじめに ===== ===== はじめに =====
    
ライン 17: ライン 14:
 ===== コーパスの目的と特徴 ===== ===== コーパスの目的と特徴 =====
  
-==== 背景と目的 ====+==== 目的 ====
  
-このコーパスの目的は、典拠のあるレトリックの用例に、誰もが容易にアクセスできるようにすることです。+このコーパスの目的は、多角的なアノテーションがほどこされた典拠のあるレトリックの用例に、容易にアクセスできるようにすることです。
  
-レトリックは、ある言語体系の可能性を最大限引き出して伝達する表現法です。レトリックは、簡単には真似することができず、ちょっとみただけではどうやって作られたか分からないほど巧みな表現で出来ています。このようなレトリックの用例を保存し、分かりやすく理解できるように系統的に分類することには、学術的、文化的な価値があると考えます。すべての用例に、[[index:​category]]、[[index:​mapping]]、[[index:​cx]]、[[index:​effect]]のような分析を付与することで、レトリックの多様な側面を理解しやすくしています。このコーパスの主なターゲットは、言語研究者です。しかし、研究者でない人でも、コーパスに収録された印象深いレトリックの表現を味読すると、面白いと感じるかもしれません。+=== レトリック ​===
  
-理論言語学的には、このコーパスは[[https://​ja.wikipedia.org/​wiki/​%E8%AA%8D%E7%9F%A5%E8%A8%80%E8%AA%9E%E5%AD%A6|認知言語学]]背景としています。レトリックは、あらゆ言語の文法語彙の中に遍在しています。この事実は、レトリックが言語能力根幹関係しることを示しています。レトリック言語研究の重要領域でり、このコーパスはレトリック研究に役立つものです。創造的なレトリックは、形式的には固定されていない(=検索しても集められない)表現であるため、機械的に用例を収集することは困難です。そこで、簡単に用例にアクセスできるデータベースがあれば便利であると考え、このコーパスを構想しました。このコーパスには、創造的な意味や印象的な効果をもつ用例が多数収録されています。+レトリックは、言語の可能性引き出して伝達する表現法です。 
 + 
 +レトリックは、簡単には真似すことができず、ちょっとみただけではどうって作られたか分からないほど巧みな表現で出来ています。このようなレトリックの用例を保存し、分かりやすく理解できるよう系統立て分類すること、学術的、文化的価値がると考えます。 
 + 
 +=== 用例 === 
 + 
 +創造的なレトリックは、形式的には固定されていない(=検索しても集められない)表現であるため、機械的に用例を収集することは困難です。そこで、簡単に用例にアクセスできるデータベースがあれば便利であると考え、このコーパスを構想しました。このコーパスには、創造的な意味や印象的な効果をもつ用例が多数収録されています。 
 + 
 +=== アノテーション === 
 + 
 +すべての用例に、[[index:​category]]、[[index:​mapping]]、[[index:​construction]]、[[index:​effect]]のような分析に関する注釈情報(アノテーション)を付与することで、レトリックの多様な側面を理解しやすくしています。研究者でない人でも、コーパスに収録された印象深いレトリックの表現を味読すると、面白いと感じるかもしれません
  
 ==== 特徴 ==== ==== 特徴 ====
  
-このコーパスの構築は、下のような方針基づいてます。+このコーパスには、以下のような特徴があります。 
 + 
 +このような特徴を備えたコーパスの構築は、初めての試みであると思われます。比喩表現の他のコーパスと本プロジェクトとの比較については「[[info:​corpuses]]」を参照してさい。 
 + 
 +=== 実例 === 
 + 
 +実際の言語使用から抽出されたレトリックの用例テクストを収録しています。(将来的にはさまざまなジャンル、年代の用例を収録する計画です。) 
 + 
 +=== 修辞学的アノテーション === 
 + 
 +広範囲の[[index:​category]]の用例を収録しており、レトリックとして認められる言語表現全般を多角的に記述します。用例を修辞学用語によって分類します。 
 + 
 +=== 意味論的アノテーション === 
 + 
 +『[[https://​pj.ninjal.ac.jp/​corpus_center/​goihyo.html|分類語彙表-増補改訂版データベース]]』をシソーラスとして、レトリックの意味を体系的に記述します。メタファー、メトニミー、コントラストの[[index:​mapping]]を記述します。 
 + 
 +=== 文法論的アノテーション === 
 + 
 +『[[http://​doi.org/​10.15084/​00003531|「現代語の助詞・助動詞」データベース版]]』を用いて、「XのようなY」「まるでXのよう感じる」とった[[index:​construction]]を構造と機能の面から分析します。 
 + 
 +=== 語用論的アノテーション === 
 + 
 +用例のコンテクストの具体的な理解にもとづく[[index:​effect]]を記述します。効果を[[index:​category#​修辞学用語一覧]]によっ分類します。
  
-  * 実例から抽出されたレトリックの用例テクストを収録する。(現在は近大文学作品から用例のみであるが、将来的にはさまざまなジャンル、年代の用例を収録する計画である。) +=== メタデータ ​===
-  * 修辞学的アノテーション:広範囲の[[index:​category]]の用例を収録しており、レトリックとして認められる言語表現全般を多角的に記述する。用例を修辞学用語によって分類する。 +
-  * 意味論的アノテーション:『[[https://​pj.ninjal.ac.jp/​corpus_center/​goihyo.html|分類語彙表-増補改訂版データベース]]』をシソーラスとして、レトリックの意味を体系的に記述し、メタファー、メトニミー、コントラストの[[index:​mapping]]を記述する。 +
-  * 文法論的アノテーション:『[[http://​doi.org/​10.15084/​00003531|「現代語の助詞・助動詞」データベース版]]』を用いて、「XのようなY」「まるでXのように感じる」といった[[index:​cx]]を構造と機能の面から分析する。 +
-  * 語用論的アノテーション:用例のコンテクストの具体的な理解にもとづく[[index:​effect]]を記述する。効果を修辞学用語によって分類する。 +
-  * メタデータのアノテーション:[[index:​name|著者名]]、[[index:​piece|作品名]]、ページ数を特定した[[index:​reference]]の情報を付与し、外部データベースと可能な限り連携する。+
  
-このような特徴を備えたコーパスの構築は初めての試みであると思われます。比喩表現のコーパスをるプロジェクトは他にもいくつかあります。これらと本プロジェクトとの比較については「[[info:corpuses]]参照て下さい+[[index:​name|著者名]][[index:​piece|品名]]、[[index:reference]]のメタ情報付与、『[[https://​id.ndl.go.jp/​auth/​ndla/​|Web NDL Authorities]]』『[[https://​ndlsearch.ndl.go.jp/​|国立国会図書館サーチ]]』などの外部データベースと可能な限り連携します
  
 ===== 基本方針 ===== ===== 基本方針 =====
  
-このコーパスは、以下の基本方針にもとづいて編集されています。+このコーパスは、「認知言語学」とよばれる言語の理論を背景とした、以下の基本方針にもとづいて編集されています。
  
   -   ​用例重視   -   ​用例重視
ライン 77: ライン 101:
  
 人類学の行動記述に文脈が必要であるように、言語学の言語記述にも文脈が必要です。レトリックの効果は、前後の文脈によって生まれます。より厳密には、その表現の背景となる情報すべてが、レトリックの意味に影響します。どのようなコンテクストによって、どのような意味が生まれているかを詳しく記述することで、レトリックはより深く理解することができると考えます。 人類学の行動記述に文脈が必要であるように、言語学の言語記述にも文脈が必要です。レトリックの効果は、前後の文脈によって生まれます。より厳密には、その表現の背景となる情報すべてが、レトリックの意味に影響します。どのようなコンテクストによって、どのような意味が生まれているかを詳しく記述することで、レトリックはより深く理解することができると考えます。
- 
-ただし、現段階で、用例には十分厚い記述がほどこされているわけではありません。修辞的効果をはじめとする、レトリックの微妙な意味合いの記述には、テクスト分析と文学的考察が必要であると思われます。 
  
 ==== 多人数による記述 ==== ==== 多人数による記述 ====
ライン 85: ライン 107:
 多人数による記述は、レトリックの定義と分類における主観性のリスクを軽減します。 多人数による記述は、レトリックの定義と分類における主観性のリスクを軽減します。
  
-認知言語学では、隠喩や換喩といった基本的な修辞学用語の定義を試みています。語用論では、皮肉の定義がいくども試みられてきました。しかし、具体例の一つ一つについて、誰もが満足する分類を行うことは容易ではありません。修辞学には無数専門用語あり、それぞれの語の定義は不明確なことも多く定義適用範囲はかなりのゆれると問題があります+具体例の一つ一つについて、誰もが満足する分析、分類を行うことは容易ではありません。多くが用例記述を編集すること問題に対する素朴な解決策になります。レトリックは多く人を納得させる言語表現です。1人納得でき記述よりも、5人が納得できる記述の方が、レトリックの分析しては妥当だと言えるでしょう。
  
-多くの人が用例記述を編集することは、この問題に対する素朴な解決策になります。レトリック多くの人を納得させる言語表現です。1人が納得できる記述よりも5人が納得できる記述、レトリックの分析としては妥当だと言えるでしょう +このコーパスでは、できるだけ多く研究者アノテーションを確認していますまた、アノテションに関する議論は、閲覧者皆様も開かれています。数の目にさらされた分析は、よりよいものになることが期待されます。
- +
-このコパスでは、複数編集者が自由ページを編集します。の分析の目にさらされた用例ページは、よりよいものになることが期待されます。+
  
  
ライン 96: ライン 116:
 ある用例ページは、さまざまなカテゴリーに多重に分類されます。 ある用例ページは、さまざまなカテゴリーに多重に分類されます。
  
-このコーパスでは、タグ機能によって、用例にさまざまなアノテーションを付けます。複数の用例に同じタグがつくと、タグは用例のカテゴリーになります。ある用例が、何のレトリックなのか、どのような意味や効果をもつのか、ということはしばしば問題になりますが、答えが必ず一つに決まるべきであるかは分かりません。このコーパスでは、各用例を排他的に分類することはありません。あるカテゴリーの定義特性を備えているならば、アノテーションはいくらでも多重化し、多層的な情報がタグづけされ、分類されます。 +このコーパスでは、タグ機能によって、用例にさまざまなアノテーションを付けます。複数の用例に同じタグがつくと、タグは用例のカテゴリーになります。このコーパスでは、各用例を排他的に分類することはありません。あるカテゴリーの定義特性を備えているならば、アノテーションはいくらでも多重化し、多層的な情報がタグづけされ、分類されます。
- +
-古典的な修辞学の理論では、「Aか、それともBか」という分類名称を決めることが議論の的になることがありますが、上記の理由から、このコーパスでは、これは決定的な問題にはならないことが普通です。+
  
 さらに、カテゴリーのカテゴリー(抽象的なカテゴリー)を作る際にも、多重分類の原則がはたらきます。これによって、特定の理論のバイアスに左右されにくく、用例記述に沿った分類体系を構築することができると考えます。 さらに、カテゴリーのカテゴリー(抽象的なカテゴリー)を作る際にも、多重分類の原則がはたらきます。これによって、特定の理論のバイアスに左右されにくく、用例記述に沿った分類体系を構築することができると考えます。
ライン 104: ライン 122:
 ===== データの収集方針について ===== ===== データの収集方針について =====
  
-このコーパスは、日本語のレトリック全体の代表的なデータを収集することを視野に入れています。どのようなリソースから用例を収集すればよいかという、いわゆる「均衡性」の問題は微妙ですが、少なくとも、年代とジャンルについては、バランスの取れたデータ収集源を選ぶことが望ましいと考えます。+このコーパスは、日本語のレトリック全体の代表的なデータを収集することを視野に入れています。どのようなリソースから用例を収集すればよいかという、いわゆる「均衡性」の問題がありますが、少なくとも、年代とジャンルについては、バランスの取れたデータ収集源を選ぶことが望ましいと考えます。
  
 ベータ版構築にあたり、日本近代文学から用例を収集しました。特に、著作権が既に切れており、『[[https://​www.aozora.gr.jp/​|青空文庫]]』に本文の電子テキストがあるものを選んでいます。これにより、本文手入力の問題と、著作権処理の問題を回避しました。 ベータ版構築にあたり、日本近代文学から用例を収集しました。特に、著作権が既に切れており、『[[https://​www.aozora.gr.jp/​|青空文庫]]』に本文の電子テキストがあるものを選んでいます。これにより、本文手入力の問題と、著作権処理の問題を回避しました。
  
-レトリックが使用されるジャンルは、文学だけではありません。少なくとも、以下のようなジャンルがデータ収集の対象になり得ます。+もちろんレトリックが使用されるジャンルは、文学だけではありません。少なくとも、以下のようなジャンルがデータ収集の対象になり得ます。
  
   * 伝記、ノンフィクション、エッセイ、評論、コラムなどの散文   * 伝記、ノンフィクション、エッセイ、評論、コラムなどの散文
ライン 118: ライン 136:
 =====  コーパスの活用法 ===== =====  コーパスの活用法 =====
  
-このコーパスは、以下のようなレトリックについての言語研究の資料として用いることができます。+このコーパスは、少なくとも以下のようなレトリック研究の資料として用いることができます。
  
   * レトリック研究における例示   * レトリック研究における例示
ライン 131: ライン 149:
   * 修辞的効果の発生条件の解明   * 修辞的効果の発生条件の解明
  
-将来的には、と作品のコーディングを利用して、文体論や文学の研究にも利用できる可能性があります。+と作品のコーディングを利用して、文体論や文学の研究にも利用できる可能性があります。
  
-  * 特定のレトリックをよく使う作家の特定 +  * 特定のレトリックをよく使うジャンルの特定 
-  * 作の執筆時期ごとの文体的な遷移の分析 +  * 作の執筆時期ごとの文体的な遷移の分析
-  * 文学作品の歴史的背景と表現技法の関連の考察+
   * 作品中に生起するレトリックの位置的分布の調査   * 作品中に生起するレトリックの位置的分布の調査
   
ライン 149: ライン 166:
   *2017年8月〜2017年9月(第2期): 用例収集と分析、意味のアノテーション基準の精緻化   *2017年8月〜2017年9月(第2期): 用例収集と分析、意味のアノテーション基準の精緻化
   *2017年11月〜2017年12月(第3期): 用例収集と分析、修辞性指標の記述フレームワーク開発   *2017年11月〜2017年12月(第3期): 用例収集と分析、修辞性指標の記述フレームワーク開発
-  *2017年2月〜2017年3月(第4期): 用例収集と分析、収集例の傾向分析、記述フレームワークの整理と改訂+  *2018年2月〜2018年3月(第4期): 用例収集と分析、収集例の傾向分析、記述フレームワークの整理と改訂
   *2019年1月〜2019年3月(第5期): Wikiでの実装、意味クラスページの導入、意味クラスの記述   *2019年1月〜2019年3月(第5期): Wikiでの実装、意味クラスページの導入、意味クラスの記述
   *2019年4月〜2019年6月(第6期): 意味クラスの記述、写像ページの機械生成   *2019年4月〜2019年6月(第6期): 意味クラスの記述、写像ページの機械生成
最終更新: 2024/02/13 10:24