NLC2013 用言等換言辞書を用いた換言結果の考察

吉倉孝太郎, 山本 和英. 用言等換言辞書を用いた換言結果の考察. 信学技報, vol. 113, no. 83, NLC2013-11, pp. 57-62 (2013.6)

原稿と発表に用いたスライドはこちらから参照ください。

発表表題と原稿のタイトルがミスにより違っています。
用言等換言辞書を用いた換言結果の考察」が正しい表題で原稿のタイトルが間違いです。申し訳ありません。

発表概要
汎用性の高い換言のための言語資源を構築したい。先行研究として、我々は「用言等換言辞書」を人手で構築した。
本発表では、この「用言等換言辞書」を用いて換言を行なった結果、どのような換言がなされるかを調査するために、毎日新聞99年版を対象として動詞のみ換言を行なった。
評価は2名で行った。多義性の解消・活用の変化については今回の意図と違うため、人手で行なった。評価データは3500文で、1文につき1語の換言後の動詞を含む。

以下の基準を評価基準として評価する。
自然な換言: 意味を等価に保って表現も自然である。
e.g.不要品を引き取る → 不要品をもらう

条件付換言:助詞等を補正することで自然な換言となる。    
e.g. 退任するのに伴い、参院自民.. → 退任するのと一緒に、参院自民..   ※伴う-一緒だ が換言対

不自然な換言: 意味は保っているが、表現が不自然になっている
e.g. 新たな仕事に一歩踏み出した → 新たな仕事に一歩はじめた ※助詞の補正等で自然な表現にできない

換言不可能: 意味が変わってしまう換言
e.g. フセイン大統領が絡む「政治事件」 → フセイン大統領がまきつく「政治事件」

評価不可能: 形態素解析誤り等は評価に含まない
e.g. シャーベットのランチセット → シャーベットくっつきのランチセット ※付くという動詞として換言されたがこれは動詞として見るべきではない

3500文中212文を2名で評価する。評価者間の一致度は2名で評価した194文で85%ほどであり、作業者間の差異は小さいものと考える。
評価の分布は以下の割合となった

自然な換言 : 54%
条件付換言 : 6%
不自然な換言 : 13%
換言不可能 : 27%
※3500文中評価不可能だったものは188文

現状の用言等換言辞書で6割程度の何らかの補正込で換言が可能
換言不可能なものの例をあげる
・適切な換言候補がない
e.g. フセイン大統領が絡む「政治事件」 → フセイン大統領がまきつく「政治事件」
これは 絡む-関わる のような対を追加することで対応できる

・分割すべきでない換言
e.g. 祖父が息を引き取った → 祖父が息をもらった
    特定の状況に的を絞った → 特定の状況に的を出した
       時間が過ぎ去る → 時間が(通り,経ち)去る
複合動詞、慣用表現を分割して換言してしまったために起こった問題である。
これは意味の上で分割してはいけない句であるので、まとめて換言するようにする。

今後の展望
・網羅性の向上
今回の例で間違った例から換言候補を追加する。
・句による換言対象の追加
分割してはいけない句を追加することでより適切な意味単位で換言することを可能とする。


会場での質疑応答
Q. 用言等換言辞書で換言しなかった語と日本語の基礎的な語彙との関係はどうなっているのか
A. 関係については調べていません。基本的な語彙については大きく変わらないとおもいますが、もっと別の語彙も換言出来ない語として存在していると推測します。


補足
評価者間で一致しなかった語については、今回は深く考察していない。評価者へのクイズになってしまうことを回避したかったためである。
一致しなかった語について、何らかの知見が得られると考えたが、換言資源として寄与出来る部分が私には思いつかない。
語の持つ感覚を付与することが考えられるが、人手で構築するのはコストの問題で現実的でない。

語ベースを換言するだけで一応6割ほどの換言は可能となる結果を得た。
しかし、語を全て換言すれば良いという問題ではないと考えている。
一部の機能表現的に作用する用言も一定数存在している。"○○に対する××が" が"○○に向かい合う××"に換言されている例である。
このような表現も検出できるような資源・もしくは処理方法を考え、意味まとまりの句の換言適否を考えることで自然言語処理のさらなる進歩に繋がると考える。

何か疑問点がございましたら、吉倉まで気軽にメール等でご連絡ください。
メールアドレスは吉倉の部分で公開しています。
Comments