IALP2014

International Conference on Asian Language Processing
開催地:Kuching, Srawak, Malaysia
開催日:2014年10月20日(月)〜 23日(木)
HP:http://ialp2014.colips.org/

全体の所感


これまで知らなかった言語・マイナーな言語についての発表が多かった.
言語ごとに特有の,あるいはマイナーな言語であるがゆえの(言語資源が少ないなどの)問題に取り組んでいるものが多かった.
「言語保存のため」という動機は新鮮で,これまでに無い視点を得ることができた.


自分の発表


Title: Semantic Type Disambiguation for Japanese Verbs
Authors: Shohei Okada, Kazuhide Yamamoto

概要

本研究室の先行研究で提案された「意味類型」を紹介し,
文中の動詞に対する,文脈による意味類型の曖昧性解消器を機械学習ベースで構築,70%の精度を達成.

意味類型は「動作」「変化」「感覚・感情」「形容」の4種類からなり,日本語に用言をその意味によって分類するために提案された.
(詳細は動詞意味類型辞書のページやその関連文献を参照)

動詞は文脈によって異なる意味類型を持っており,本研究では文脈より意味類型を1つに決めることを「意味類型曖昧性解消」と定義している.

例)
動詞「満たす」は「動作」と「形容」の意味類型をとり得るが,
  • 「コップに水を満たす」という文では「動作」
  • 「条件をを満たす」という文では「形容」
の意味類型持つということを自動で推定する.

曖昧性解消器は公開予定である.


補足

日本語の動詞/形容詞は形態的な分類に基づいており,必ずしも意味的に分類されているとは限らない.
しかしながら,一般的に動詞は観測可能な動作・変化を,形容は特性や状態を表すとされており,
自然言語処理において,そういった特性を期待して品詞情報が用いられることがしばしばある.
そのような用途に置いて,品詞情報の代わりに意味類型を用いることで性能向上が期待できる,と考える.

動詞が形容詞的な意味を持つというのは,日本語に限った問題ではなく,
他の言語においても同様な研究を行えばその貢献は大きいと考える.


質疑応答

  • なぜSVMを用いたか(なぜ他の分類手法を用いなかったのか)
    • 本番では「特に他の手法を使わなかった理由は無い」と答えてしまった.
    • 実際には
      • まず,機械学習ベースであること.訓練事例があればルール等を自分で構築する必要がない.
      • 学習するパラメータ数を少なく抑えられるため,(少ない訓練事例でも)過学習が起きにくい.
  • この手法を多言語に応用可能か


反省

  • 伝えたい内容はひと通り話すことができたと感じる一方で,自分の中でベストを尽くせた,とは言いがたい.
    • 途中で原稿を確認したり,つっかえたり.
    • 発表に間に合わせることで精一杯になっていて,喋る練習のための時間を多く避けなかったことが原因.
  • 質疑応答はグダグダだった.
    • 緊張からか質問をよく聞き取れず,見当違いな回答をしてしまった.

「岡田 正平」に戻る
Comments