期間: 10月24〜25日 10月26日(蘇州→上海→浦東国際空港) 10月27日(浦東国際空港→茨城空港→東京→長岡) 発表内容: Japanese Sentence Compression using Simple English Wikipedia Authors: Shunsuke Takeno, Yamamoto Kazuhide 概要: We describe a cross-lingual approach for sentence compression of articles of Japanese Wikipedia using the correspondence of articles of Simple English Wikipedia. Taking advantages of the nature of the corpus, we can find essential parts from encyclopedic description without highly depending on the statistical information which are noisy. We manually explored the correspondences between the articles of Japanese Wikipedia and those of Simple English Wikipedia and then proposed a cross-lingual alignment method using simple matching algorithm. We provide an analysis of the abovementioned correspondence and the preliminary result of sentence compression using Simple English Wikipedia. 質問内容について: 1. データの数値について計算ミスが見られる. 2. なぜ2つの実験でデータ数が異なるのか 3のアルゴリズムの性能だけを評価するために 2の実験で, 文間に"十分対応関係"があるものを評価セットとして用いたため. 3. 圧縮された文はどの程度流暢であるか? 依存関係構造を考慮しているため可読性という観点からは十分に流暢であると考えている. ただし依存関係のパーシングが失敗しているものに対しては難しいし, 文節を削除しただけでは 若干違和感を感じるような文が生成される. この解決のためには 機能語などの書き換え知識が必要である. |