外界照応及び著者・読者表現を考慮した 日本語ゼロ照応解析

Japanese Zero Reference Resolution Considering Zero Exophora and Author/Reader Mentions

Bibliography

HANGYO, Masatugu, Daisuke KAWAHARA, and Sadao KUROHASHI. 2014. Japanese Zero Reference Resolution Considering Zero Exophora and Author/Reader Mentions. Journal of natural language processing vol.21, : 563–600.

Abstract:

In Japanese, zero references often occur and many of them are categorized into zero exophora, in which a referent is not mentioned in the document. However, previous studies have focused only on zero exophora, in which a referent explicitly appears. We present a zero reference resolution model considering zero exophora and authors/readers of a document. To deal with zero exophora, our model adds pseudo-entities corresponding to zero exophora to candidate referents of zero pronouns. In addition, the model automatically detects mentions that refer to the author and reader of a document using lexico-syntactic patterns. We present particular behavior of authors/readers authors/readers in a discourse as a feature vector of a machine learning model. The experimental results demonstrate the effectiveness of our model for not only zero exophora but also zero exophora.

ゼロ照応解析について

日本語では、ゼロ代名詞(必須格の省略)の利用が非常に多い.

照応解析を行う時には、まず必須格が何かを知る必要がある。 そこから候補となる単語を探し出す必要がある。

具体的には

  • 用言の項構造の解析(述語鋼構造解析)を行う
    i.e) 京大格フレームコーパス
  • 用言の選択選好性を利用する.
    乗る → [乗り物]となるような単語(車、自動車、二輪など) といったように用言には名詞の選好性がある

格について照応の分類

  • 文章内ゼロ照応解析(前文などのゼロ照応解析)
  • 外界ゼロ照応解析(文章外の要素:著者・読者など)
  • ゼロ照応なし(ゼロ代名詞をとらない)

所感

ゼロ照応解析について、「はじめに」「関連研究」が非常にまとまっていると感じる。
ゼロ照応解析は日本語などのハイコンテクストな言語で盛んである。
しかしながらその要素技術は、西欧・欧米でも盛んな技術が利用されている。

またタスクの性質から、述語構造解析とも関連が深いので それについての知見を持っておくとより理解が進むと思われる

Comments