1stWeek - 2014.02.20


自然言語処理研究室 B4ゼミ 第01回
==============================
last update:2014-02-20

発表スライド
---------------


高橋 - コーパスからのコロケーション情報抽出
-----------------
    コロケーション … 文の慣用的パターン

    言語学の分野の内容 ⇒
        発話に意図した則した表現をとる必要がある
            慣用表現 … 息をのむ

        コロケーション情報を得るには, 文字の表面的処理だけではダメ
        コーパスによって得られる共起表現は限られる.

        コーパスからコロケーションの抽出




後藤 - オントロジー構築
---------------
    「Wikipedia」のis-a関係のリンクを判定 - 柴木さんの論文

    主要カテゴリ 9 つに分ける Wikipediaから
   
    Wikipediaのリンクとis-a関係を抽出
        基本的には既にあるリンクから余計なリンクを削除する 方針
   

伊藤 - ファクトイド型質問応答
---------------
    ファクトイド型質問 … 特定の解答がある問題

    ファクトイド型質問応答のシステム
        質問解析 ⇒ 情報検索 ⇒ 回答候補抽出 ⇒ 回答候補応答

    質問解析:内容語の解析,
        回答内容の分類(PERSON, ORGNIZATION, LOCATION)
            分類カテゴリの数の決め方
         ルール記述言語を作成.
            ルールを機械的に学習させる.
            教師有学習

    情報検索:全文検索
        転置インデックス
        文字n-gram : 辞書から特徴的な単語を
        接尾辞配列 :

    回答候補の抽出:
        固有表現抽出⇒IREXのタグ(PERSON, LOCATION)

    回答候補応答:


Comments