言い換え箇所と言い換え候補の提示による解説文リライト支援の書き手の評価実験

藤沢仁子, 神門典子, 相原健郎, 安達淳. 言い換え箇所と言い換え候補の提示による解説文リライト支援の書き手の評価実験. 情報処理学会研究報告 2009-NL-190 pp.59-66

1.背景
  • 博物館や科学館のコンテンツの解説文は、非専門家や子どもには理解が難しい
  • 易しく言い換えた方が良い表現が多いが、なかには知識として学習するべき専門用語もある
    →これらを考慮して、解説文をリライトする際に、言い換え箇所と言い換え候補を提示することで、作業の負担が軽減されるかを調べる
    文章の特徴
  • 画像やオブジェクトに付けられた説明
  • 画像など視覚的に情報がある点
  • 200字程度の簡潔な文章
    用語の言い換え
  • 専門用語を残した言い換え
    • カテゴリの補足
    • 用途・目的の補足
    • 形状の補足
    • 位置の補足
  • 易しい用語への言い換え
    • 一般名詞への言い換え
    • 身近なものへの言い換え
    • 一般名詞に位置/場所を補足
    • 小学国語辞典の語釈文と同等表現への言い換え
    専門用語
  • 専門用語:ある特定の分野に属する用語
    →ある分野に特有で、他の分野の語や一般的な他の語に置き換えることができない語(本研究
  • 非専門家には馴染みが薄く、テキストを難関にする原因となっている
    →しかし、他の語に置き換えることのできないものもあり、小学校の教科書では別途に用語説明を設けて理解を支援している

2.先行研究
  • テキスト簡略化・記述の難易度の判定
    • 聾者のコミュニケーション支援に向けたテキスト簡略化技術の研究(2001, 乾健太郎)
    • 災害時に在日外国人に重要な情報を提供するための文章作成ガイドライン「やさしい日本語」
      http://human.cc.hirosaki-u.ac.jp/kokugo/EJ3mokuji.htm
    • 日本語能力試験「出題基準」を元に漢字・語彙・文法・量的複雑さの4部門に分けて3段階の平易度を定義(2003, 佐藤理史ら)
    • 日本語教材の語彙の規格判定を行う「リーディングチュウ太」の語彙レベル判定ツール
      http://language.tiu.ac.jp/
    • 小学5年の児童を対象に、光村図書出版が「語彙指導の方法[語彙表編]」の中にまとめている「学習基本語彙一覧表」を元に、
      光村図書の国語教科書における各単語の初出情報と単語親密度の実験(2005, 渡辺哲也ら)
    • 小学校から大学の教科書を収録対象とした日本語教科書コーパスを使用した難易度推定の研究(2008, 佐藤理史ら
  • 専門用語の抽出
    • 専門用語の多くが複合名詞であるということに着目し、出現頻度と連結頻度に基づいて専門用語を抽出(2003, 中川裕志ら)
    • 文書の分野判定を行うための専門用語の抽出(2006, 佐藤理史ら)

3.リラリト支援システム
    難解語・専門用語の選定
  • 小学生の語彙特性を考慮し、まず言い換えが必要な語句を選出し、その中から知識として残すべき専門用語を特定する
  • 実験のポイント:言い換え箇所と言い換え例の提示が書き手の支援になるかどうか
  • 言い換えが必要な語句の選出には、小学国語辞典を理解語彙として使用する
    (光村図書出版「語彙指導の方法」に小学生の理解語彙の上限として定められている「学習語彙」と同等レベルで、比較的容易に入手できる)
  • 言い換え後に残すべき専門用語として、大辞林に見出し語として収録する語彙を用いる
    (約24万語を収録している大辞林は、国語辞典と百科事典の両要素を併せ持つ辞典であり、編纂には各分野の専門家が参加している)
    (通常の百科事典が図などを用いて総合的に解説しているのに対して、大辞林は言葉で端的に説明している)
  • 大辞林に載っている専門用語
    • その専門分野における基礎的な用語
    • 日常生活とかかわりの深い専門用語
    • 一般的な教養として知っておくことが必要だと思われる専門用語
  • 今後は小学生新聞の文章分析などを行っていく

参考文献
    佐藤理史, 土屋雅稔, 村山賢洋, 麻岡正洋, 王晴晴. 日本語文の規格化. 情報処理学会 研究報告 NL-153, pp.133-140(2003年1月)
    川村よしこ. 語彙チェッカーを用いた読解テキストの分析. 講座日本語教育. Vol.34, pp.1-22, 1999
    渡辺哲也, 大杉成喜, 澤田真弓, 山口俊光, 渡辺文治, 岡田伸一. スクリーンリーダの漢字詳細読みに関する研究−児童を対象とした言葉の親密度調査−. 電子情報通信学会技術報告, WIT2005-04, May 2005
    松吉俊, 近藤陽介, 橋口千尋, 佐藤理史. 全教科を収録対象とした日本語教科書コーパスの構築. 言語処理学会第14回年次大会発表論文集, pp.520-523, 2008
    近藤陽介, 松吉俊, 佐藤理史. 教科書コーパスを用いた日本語テキストの難易度推定. 言語処理学会第14回年次大会発表論文集, pp.1113-1116, 2008
    中川裕志, 森辰則, 湯本紘彰. 出現頻度と連接頻度に基づく専門用語抽出. 自然言語処理Vol.10 No.1, pp.27-45, 2003
    木田充洋, 外池昌嗣, 宇津呂武仁, 佐藤理史. ウェブを利用した専門用語の分野判定. 電子情報通信学会論文誌. D, 情報・システム=The IEICE transactions on information and systems(Japanese edition), 89(11), pp.2470-2482, 2006
    藤沢仁子, 神門典子, 相原健郎, 安達淳. 小学生の語彙特性と専門用語に着目した言い換え箇所の分析. 言語・音声理解と対話処理研究会 52, pp.21-26(2008年3月)
    倉島節尚. 一般辞書と専門用語:辞書編纂と専門用語. 専門用語研究 No.1. 情報知識学会. pp.10-17, 1990 など

Comments