換言処理の現状と課題

山本和英. 換言処理の現状と課題. 言語処理学会第7回年次大会ワークショップ論文集, pp.93-96 (2001)

1.換言処理の定義
  • 換言処理とは、言語表現と換言因子を入力し、換言因子に沿うように入力表現を変換する処理である
    →ある入力表現に対して、このように言い換えたいという要求(換言因子)を満たすように表現を変換する処理
    • 一般には、(同一言語の)同義表現への言い換えと理解されている
      →同一の明示的意味を持つ表現への言い換え(言語表現の意味を"明示的意味"と"言外の意味"に分ける考え方)
    • "何かが同一なものへの変換"ではなく"何かの目的を満たす表現への変換"と捉える
      →入出力の同一性に着目するのではなく、入力表現に対する基準達成の是非に注目
    • 必ずしも入力表現と異なる表現に言い換えないといけないわけではない
    • 換言因子を特定しない場合(目的任意の換言処理)は、必ずどこかの表現を言い換えて出力する
    • このように定義すると、次のものは換言処理と位置づけることができる
      • 報知的な要約処理
      • 機械翻訳における前編集・後編集
      • 自動的な文章の推敲・校正処理

2.仮説生成と選択
  • 言語処理研究を今後さらに進めるためには、もっと"仮説を作る努力"をしなければならない
    →仮説列挙に最も深く関わる処理が換言処理
  • どのような換言処理を、どのように(自動)獲得して、知識としてどのような形式で表現するのが望ましいか、の検討が重要

3.換言処理に必要な機構
  • 換言処理を"単言語内翻訳"と捉える見方もあるが、機械翻訳と換言処理は処理に必要な機構が大きく異なる
    • 機械翻訳:解析・変換・生成の処理対象が、ともに入力の全表現
    • 換言処理:処理対象を特定した後は、処理対象表現のみを表現変換する
      • 対象特定:換言因子を参照して入力表現のうち換言すべき表現を特定する
      • 仮説生成:予め準備した換言知識を用いて換言表現を生成または検索する
      • 仮説選択、換言:入力表現に対して最適な表現を選択し、換言する
               同時に、換言によって影響を受ける周辺表現の調整を行う
4.換言による曖昧性解消
  • さまざまな換言因子のうち、曖昧性の減少を因子とする換言処理が非常に重要
  • 換言処理による意味の記述は、多義を持つ表現をより明確な表現に置換するので、以降の処理と親和性が高く、汎用性も高い

5.我々は何をしなければならないか
  • 換言因子の列挙
    →どのように表現を言い換えたいのかを明確にした上で、研究の立場を明らかにしなければならない
    • 入力誤り訂正:誤りのない表現に
    • 推敲・校正:より自然な表現に
    • 計算機処理に対する頑健化:構文解析可能な表現に
    • 要約:より短く
    • 詳細化:より曖昧さの少ない表現に
    • 簡潔化:易しく、わかりやすく
    • 文体:話し言葉や書き言葉に
    • 性別:男言葉や女言葉に
    • 年齢:子供や高齢者の言葉に
    • 方言:方言や共通語に
    • 換言因子なし:狭義の換言処理
  • 換言対象表現の列挙
    →入力とする文のどこをどのように言い換えられるのか、という言い換えパターンをできるだけ豊富に想定しなければならない
    • 名詞句を名詞句または短縮形に
      • 駐留軍用地特別措置法→特措法
    • 複数の動詞句をひとつの動詞句に
      • よく話して納得させる→説得する
    • 和語動詞を漢語動詞に
      • 入学式に桜が開花する→入学式に桜が咲く
    • 連体修飾表現の変換
      • 雨が降った日→雨の日
    • 受動態や能動態に
      • 犬が彼に噛みつく→彼が犬に噛みつかれる
    • 動詞性名詞を含む複合名詞を動詞句に
      • 構文的予測→構文的に予測する
    • 条件表現に含まれる可否表現の削除
      • 電源を投入しないとシステムを使えない→電源を投入すればシステムを使える
    • 主語、目的語のない動詞構文の変換
      • 二機種合わせて月産四百台生産する→二機種の合計月産は400台だ
    • 連体節の主節化
      • この間までは受験で悩んでいた満男がもう転職で悩んだりしています。
        →満男はこの間までは受験で悩んでいた。満男がもう転職で悩んだりしています。
  • 応用分野の開拓
    • 子供、高齢者、外国人に向けての情報発信として
    • 要約処理として
    • 推敲処理として
    • 機械翻訳として
    • 電子透かしとして
    • 情報検索、情報抽出として
  • 換言知識の蓄積、共有
    • 上述の通り、換言処理は高度な言語処理の実現のために必須
      →換言処理に必要な知識を蓄積・共有することは多くの言語処理の進展につながると期待できる
    • 換言知識はコーパス、辞書、シソーラスなどと同様に重要な言語資源である
      • 実際に換言処理を行なっている現場から知識を抽出できるかもしれない
      • 換言処理を直接の目的として換言事例を収集する努力も行う必要がある

参考文献
        藤田篤, 乾健太郎, 乾裕子. 名詞言い換えコーパスの作成環境. 信学技報, TL2000-32, 電子情報通信学会 (2000)
        林良彦, 菊池玄一郎. 日本文推敲支援システムにおける書換え支援機能の実現方式. 情報処理学会論文誌, Vol.32, No.8, pp.962-970 (1991)
        金子和恵, 八木沢津義, 藤田稔. 話し手の性別・年齢を反映する文生成システム. 情報処理学会研究報告, NL116-19, 情報処理学会 (1996)
        松本恭子. 緊急時の行動を「やさしい日本語」で教える. 月刊日本語, Vol.13, No.2, pp.28-35 (2000)
        白井諭, 山本和英. 換言事例の収集−日英基本構文を対象として−. 年次大会講演論文集, 第7回, P1-12, 言語処理学会 (2001) など

Comments