表題 | 言い換え技術に関する研究動向 | 著者 | 乾 健太郎、 藤田 篤 | 掲載誌 | 自然言語処理 2004年10月 Volume11 Number5 |
言い換えとは 言い換え:意味が近似的に等価な言語表現の異形
人間のために言い換える
- 利用者の言語能力に合わせて読みやすい平易な文面に直す
→電子化文書データの増加にともない、それらを高齢者・子供・外国人・障害者といった利用者や 利用形態に適した文書に自動編集する技術が必要になった。 - コンパクトな表現に直す
→以下のような場合には、1行あたりの字数を少なくしたい。 - ニュース原稿から字幕を生成
- Webの文書を携帯端末に表示
- ニュースを電光掲示板に表示
- 推敲支援
→人間が文書を書くときには、以下のような作業を支援する技術が必要とされている。 - 読みやすい文書を書く
- スタイルを統一する
- 規定の語彙と構文を使って制限言語文書を書く
- 機械翻訳の後編集
→機械が出力した文書をチェックし、適格でない表現を自動で修正できればありがたい。 - 自動要約
→人間は原文にない表現をうまく使って内容をまとめることができる。 これも言い換えの一種であり、これを自動化することが自動要約における重要な課題となっている。
言語の機械処理のために言い換える
- 前処理
→以下のような場合の前処理として言い換え技術を用いることで、訳の質を向上させることができる。 前処理は、言語が持つ表現の多様性を吸収できると期待されている。 - 機械翻訳のための前処理(機械処理に適した表現に)
- 手話への翻訳のための前処理(手話に変換しやすい表現に)
- 音声合成のための前処理(耳で聞き取りやすい表現に)
- 情報検索や質問応答
→例えば、「(著作名)の著者は(人名)だ」と「(人名)が(著作名)を発表する」の言い換えを認識することができれば、 「〇〇の著者は?」という質問の答えを「××が〇〇を発表した年には・・・」という記述中から探し出すことができる。
言い換えを研究の道具として使う
- 機械翻訳システムの評価用正解翻訳例の自動生成
→機械翻訳では、複数の正解翻訳例を用いて評価することが一般的である。 しかし、たくさんの正解翻訳例を人手で作るのはコストが高いので、言い換え技術を用いて自動生成する。
|
|