自然言語処理研究室 B4ゼミ 第01回 ============================== last update:2014-02-20 発表スライド --------------- 高橋 - コーパスからのコロケーション情報抽出 ----------------- コロケーション … 文の慣用的パターン 言語学の分野の内容 ⇒ 発話に意図した則した表現をとる必要がある 慣用表現 … 息をのむ コロケーション情報を得るには, 文字の表面的処理だけではダメ コーパスによって得られる共起表現は限られる. コーパスからコロケーションの抽出 後藤 - オントロジー構築 --------------- 「Wikipedia」のis-a関係のリンクを判定 - 柴木さんの論文 主要カテゴリ 9 つに分ける Wikipediaから Wikipediaのリンクとis-a関係を抽出 基本的には既にあるリンクから余計なリンクを削除する 方針 伊藤 - ファクトイド型質問応答 --------------- ファクトイド型質問 … 特定の解答がある問題 ファクトイド型質問応答のシステム 質問解析 ⇒ 情報検索 ⇒ 回答候補抽出 ⇒ 回答候補応答 質問解析:内容語の解析, 回答内容の分類(PERSON, ORGNIZATION, LOCATION) 分類カテゴリの数の決め方 ルール記述言語を作成. ルールを機械的に学習させる. 教師有学習 情報検索:全文検索 転置インデックス 文字n-gram : 辞書から特徴的な単語を 接尾辞配列 : 回答候補の抽出: 固有表現抽出⇒IREXのタグ(PERSON, LOCATION) 回答候補応答: |