5th Week - 2014.02.04, 2014.02.05

自然言語処理研究室 B3ゼミ 第05回
==============================
last update:2014-02-05

発表スライド
---------------


高橋 - コーパスについて 2nd + 論文紹介「自然言語処理の再挑戦~統計的自然言語処理を超えて~」
---------------
    コーパスの作成
        コーパスの設計…母集団
        データの電子化…書式,文字コードの統一
        データのアノテーション
            品詞タグ付け(英語,日本語),形態素解析(日本語)   
           
    コーヒーブレイク…人間の文字認識(最初と最後があってれば認識できる)

    論文紹介「自然言語処理の再挑戦~統計的自然言語処理を超えて~」
        言語処理はラベル付問題
        辞書とコーパス
            IPADIC辞書,
        大規模テキストデータ
        言語解析ツール
            ChaSen, JUMAN, MeCab, CaboCha
                こっちの研究室では,MeCabメイン
                宮西さん⇒形態素解析ツール(MeCabベース)
            それぞれの特性とは?
        コーパスの作成・管理ツール
            * 接尾辞配列…高速なテキスト検索…似たイメージ
                LCPを利用する事でO(n^2logn)⇒O(nlogn)
               高速文字列解析の世界…岡野原大輔
            Chaki…表で解析結果分析できる.
                   係り受けの分析結果を表示できる便利ツール
                  単語の共起,N-gram単語の分析できる.
            ラベル付与.
               


後藤 - オントロジーの構築の考え方と指針
---------------
    * クラス分類の基準の同一性
        子の性質は親と同じ性質である.
    * インスタンス集合のパーティション性
        インスタンス集合が独立 かつ その和集合 = パーティション
    * クラスは本質属性を持っている
        固定性 … インスタンスごとに変わらない
        非外部依存性 … 色,数値の違い
        唯一性 … 例外ある(馬,二輪車・四輪車)
            ロール
                クラス分類
                     ロール概念, ロールホルダー ,基本概念
                インスタンスモデル
                   
    ロール・関係概念理論に基づく… 古崎



伊藤 - 質問応答の歴史(1)
---------------
    システム例:
        Baseball(1970):
            疑問文型の定型表現から⇒場所
            YES,NOかデータ表示するだけ
        SHRDLU:
            積み木の構文の曖昧性. 
        QUALM(1977):
            一般的背景知識を持ってる?

    質問応答するための自然言語インターフェース
        1.構文解析
        2.意味解析
        3.論理形式や中間的な意味表現に変換
        4.知識照応
   
    

Comments