NLP2014

2014/03/17        チュートリアル(未参加)
2014/03/18~20   本会議
2014/03/21        ワークショップ

気になった発表

D1-3 確率的ブロック編集距離

C3-4 簡単なイディオムの異形規則の作成:プラットフォームと日本語の異形規則

A4-2 オラクル要約の列挙
 - オラクル要約とは
 -- システムが出力可能で
 -- 評価関数(例えばROUGE)を最大化するような要約
 - 単調増加で劣モジュラ性の評価関数であれば適用可能な手法
(現実問題,要約の評価関数がROUGEぐらいしか無いが)

E5-3 柱脚表示機能を備えた論文閲覧システムSidenoter
 - 非常に便利そう

E5セッションのディスカッション
 - 論文の提出の仕方が変わってくる?(構造化テキスト)
 - 論文というものに対する考え方を変えていかなければならない
  (電子書籍だったらページ数いらないとか)
 - 論文・予稿集をすべて公開し,コーパスとしてりようすることは良い試みである.これを他の分野に広げていくため,これをやるとこんないいことがある,ということを言語処理学会として広めていけるといいことだと思う.
 - 一方で,こういったデータからマイニングすることによってなにか良からぬことに利用されてしまうのでは?(意識して書いていなかったことが解析されると慌てることがある)
 - テキストを公開しているから,何でもしていいわけではない?
 - 一方で研究者は,そういうものだと腹をくくらなければならない時代か?

E7-2 限定継続を用いたinverse scopeの分析と実装
 - NLPとしてより,単純にプログラミング手法としてCPS変換に興味

E7-4 ツイートの情報量について-情報理論に基づく多言語調査-
 - 予想通り,中国語・日本語・韓国語は1文字当たりの情報量は多い
 - しかし,1ツイートあたりの情報量はそんなに変わらない.

E7セッションのディスカッション
 - レキシコンの整理は,多人数でやっては一貫性を保たせるのが難しい
 -- 結局は「虫にならないといけない」「少数の人が命をかけてやらないとならないことか」
 - 言語学の人はオープンな問題を嫌がる?
 - 言語学の人から見て,何をやったら誰が喜ぶのかがわかりにくい
 - 与えられたテキストを解析するのばかりではなく,言語を設計するような研究が増えて欲しい(制限言語など)

自分の発表
P5-5 動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
 - 概要
 - 補足情報
 - 質問等
 -- なぜ4種類なのか?そして,なぜその4種類なのか?
 -- 4つの意味類型で意味をどれくらいカバーできているか?
 -- テキストマイニングにおけるフィルタリングで利用できそう
 -- 主語をfixして変化の動詞を収集するなど,この視点でマイニングしたいことはある
 -- 複数の意味類型を持つ動詞を対象に,少数でもいいのでやってみないとなんとも言えないのでは?
 -- 曖昧性解消は格解析の問題に落とし込めるかもしれない(KNPは動詞を語義ごとに扱っている)
 -- 動作を表す動詞は一般的にガ格は必須書くとされているのに,実際には省略されている,などといった観点から興味深い結果ではあると思う.
 -- 知識獲得に使えそう
 -- 形容詞の格フレーム情報とも比較してみると面白いかも
 -- 具体的な応用を考えないと分類の基準が定まらないのでは
 --- この分類が出来ると何が嬉しいのか,何に使えるのかを念頭においてやらなければならない
 --- 何のために,何に使うためにという観点で
 -- 曖昧性解消器でなくても,タグ付けされたデータ自体も公開して欲しい
Comments