Less Grammer, More feature



[1] D. Hall, G. Durrett, and D. Klein, “Less Grammar, More Features,” Proc. 2014 Assoc. Comput. Linguist., 2014.
参考資料 能地宏,“Less Grammar , More Features" ACL@読み会:, 2014. .


#概要 
ACL2014の論文. 
 
パーサについて
本論文では、人手で与える文規則(Grammer)について今までは、与えれば与えるほど精度向上につながると考えられてきた。 
しかしながら、少ない文規則でもうまい素性素性を抽出してやれば表層系だけでも高精度の結果を得ることができる. 
と主張している。

構文解析および意味解析で、表層系の素性でstate-of-artな精度を達成している

#これまでのPCFG
そもそも構文の曖昧性がかなりの問題になっている.
文法的に間違っていないが、人間の解釈の選好がある

Naive PCFG : 木の構造 = 親ノードと子ノードの確率値の掛け算
    もっとも単純な構造解析方法
Head Lexicalization: 葉ノードの情報を親に伝搬.
    ルールが膨大. 
    他言語への拡張性が高くない
Latent Annotating
    各ノードの隠れ状態を推定. (Matuzaki et al.'05; Petrov et al.'06)
    LDAと計算的には同じ、はず?

#本論文のアプローチ
アノテーションを最低限にした状態で、どこまで構文解析の精度を上げれるのか? 
曖昧性の解消をう行うときに、ノード情報というのは本当に必要なのか?
※アノテーションというのはコストが高い上、言語ごとに準備する必要がある.
 
実際Grammerがあまりない条件で、これまでの最高精度90.1%と同程度の結果がている(89.2%)
どの言語に大してもチューニングなしでかなりの高精度をたたき出してること(あのバスク語でも約84%をたたき出している)

Property Rule を選びだすのがなかなか難しかったりもする. 
そうすると Barkley Parserのほうがよいのかもしれない
 
#所感 
人手で与えたルールよりも素性選びが重要であるということがわかる。 
実際人間がルールの通りに把握しているわけでなく、 
無意識に特定の単語の始まりや特定の単語の終わりなどを目印にしていると考えれば 
直感的


Comments