角張 竜晴‎ > ‎読了論文‎ > ‎

述語項構造解析のための格フレーム辞書構築の検討


統語解析の精度向上に伴い、述語と項の関係を捉える述語項構造解析に関する研究が盛んに行われている。
言語資源としては、NAISTテキストコーパスの存在意義が大きい。

NAISTテキストコーパス
・述語項構造を意味構造からの写像と捉え、意味構造を復元する情報を獲得しようとすると、付与されている項の情報が表層格「が」「を」「に」に限定されていること
・述語の語義の区別がされていないこと
以上より、十分な情報を持っているとは言えない

意味構造や述語の語義のような詳細な情報を含めて述語項構造情報をコーパス全体にわたって、いかん性を保持して付与しようとすれば、各述語の語義ごとにそれぞれの項構造情報を列挙したもの(格フレーム)が必要。
英語では、FrameNetやPropBankがある。

格フレーム
定義
・動詞の語義ごとに、項構造情報を列挙する
・項構造情報として、項ごとに意味役割選択制限の情報を持つ

同じ表層形を持つ動詞であっても、基本的に語義によって異なる項構造を持つと考えられるため、格フレームは語義ごとに定義する。

項構造情報としての意味役割は、動詞に対する項の役割を表す。
複数の動詞の語義の間で、同様の役割を持つ項を識別するために付与する情報である。(e.g. 動作主, 対象)

選択制限は、各項の取り得る条件を表したもの。
主に項になり得る名詞句の意味クラスを記述する。
WordNetや日本語語彙大系のシーソラスで定義された意味クラスで定義することが多い。

格フレームを構築する上での課題と方針
一貫性
不維持した意味内容を持ち、類似した統語構造を持つ各フレーム間で、一貫した記述内容となる必要がある。
格フレーム内で動詞に対する項の意味役割を適切に定義することが必要。

網羅性
・国語辞書等で定義されている動詞の語義に基づき、シソーラスの意味クラスを用いて選択せ一限を記述した格フレーム辞書は人間の可読性が高い。
・だが、網羅性が問題である。

・網羅性を高めるためには、Webとうの大規模文書から格フレームを自動獲得することが有効。
・獲得された格フレームと動詞の語義との対応付けが課題。

⇨動詞の語義を分類して体系化し、語義の分類谷で共通な意味構造記述をおkなうことで一貫性を確保する。意味役割の定義はその共通な意味構造記述の中で定義する。

動詞項構造シソーラスの概念ノードのインスタンスが、格フレームである。
格フレームは、概念ノードのインスタンスである動詞の語義に対応づけられるので、同じ概念に属する格フレーム同士は、同様の意味構造を共有していると考えられる。




Comments