本研究室では自然言語処理に関する様々な研究を行っています。ここでは、最近(2011年以降)の研究トピックを紹介します。 (各スライドはクリックで拡大表示します)
換言処理・表現平易化 換言処理とは、入力した文や文章を違う表現に自動的に置換する処理で、「言い換え」「書き換え」「パラフレーズ」などとも呼ばれます。本研究室では、換言処理を実現するための様々な基礎的技術の検討、言語資源の作成、及び換言処理の中で社会的需要が高いと考えられる表現平易化(やさしく言い換える処理)の研究を行っています。
意味解析・意味資源構築 近年の自然言語処理は、統計処理偏重の時代が終わりつつあり、再び「意味」を(統計と同程度に)重視する流れとなってきています。本研究室では、意味を理解するための言語資源の構築や、テキスト含意認識などの意味処理の研究を進めています。

談話解析 談話解析とは、単一の文では解決できず、複数の文を処理対象にすることによって初めて可能となる解析の総称で、文書解析や対話の処理などがこれに含まれます。本研究室では、文書に書かれている内容を把握するための「記述要素」の研究などを進めています。
統計的自然言語処理 近年になって言語統計情報が大規模化しており、これの有効利用方法や応用処理など、言語統計情報を最大限活用する様々な研究を進めています。機械翻訳の研究はいわゆる統計的機械翻訳(statistical machine translation)とは別の処理の検討を行いました。また「構文片」という、本研究室で提案している言語処理単位について特性の調査を行い、構文的な情報を最低限持っていることで n-gram 統計量よりも有用な処理単位であることを示しました。
産業日本語・大規模文書活用処理 現代社会ではWeb上や企業などの組織において様々な電子化文書が生産され、蓄積を続けています。これらは従来人手で個別に再利用されることはあっても、大規模であることを利用して機械処理されるされることは少ないのが現状です。しかし、有効活用することで従来にない様々な処理が可能となると期待されています。本研究室では、業務上大量の文書を保有する保険分野への応用、及び膨大な質問と回答を持つQ&Aサイトへの応用について研究を行っています。
他言語処理(ベトナム語) 本研究室での処理対象言語は主に日本語ですが、留学生などの日本語以外の話者が配属された場合には、無理に日本語処理の研究を行うのでなく、その学生の母語を対象にして研究を進めています。これまでに、ベトナム人留学生がベトナム語の発音符号(diacritic)を統計情報を用いて復元する研究を行いました。
|