整合性を考慮した物語要約システムの構築

横野 光
整合性を考慮した物語要約システムの構築
自然言語処理,Vol.15,No.5,pp. 45-71(2008)

入力:物語
出力:報知的要約

物語は複数の話題で構成された文書

登場人物に着目した重要度によって抽出する話題を決定
抽出した話題間の整合性を保つために,話題間の状況の変化を示す文を補完

手法

1.登場人物抽出

文字情報と形態素情報を利用して,登場人物候補を辞書登録
その辞書を利用して係り受け解析,かかり先の動詞の意味から人物表現を同定

2.トピック・ブロックの抽出

1文単位のを仮定,それが連続する文をまとめることでトピック・ブロックを作成

3.重要ブロックの決定

まず,どのような物語でも比較的重要と考えられるトピック・ブロックを重要ブロックとして選ぶ
登場人物表現が 最初に出現する文→その登場人物の説明
        最後に出現する文→その登場人物の最終状況の説明
次に重要度計算
登場人物が行動を起こし,それによって状況が変化するような箇所が重要という考え

4.ブロック連結文の抽出

隣接する重要ブロックにおいて片方に出現し,もう片方には出現しない登場人物は重要ブロック間の状況変化に関わっているという考え


要約率と用意役における重要ブロックの割合を決める

評価方法

入力文書(物語)は青空文庫より,口語文法,現代仮名遣い,3人称視点のもの→9文書
1人称視点では,語り手となる登場人物の心理描写と,行動を述べる文との判別が困難になると考えた

10人の被験者の主観的評価
tf-idfと比較

メモ

登場人物に注目
指示的要約をやる場合とは要約率が全く異なる
ベースには使える?
評価方法は参考にできそう
被験者に9つの物語を読ませるとなると,結果が出るまでかなり時間がかかりそう
被験者ってどう選ぶ?
入力文書を,システムの特性から考えて制限している

「文献紹介」に戻る

Comments