2013.12.16


・自然言語処理の基礎
    第一章、第二章(高橋担当):
        自然言語処理のイメージ: Siri, Google翻訳, 検索、データマイニング…
        日本での自然言語処理の始まり:1978年(未だ40年程度の分野!)   

        日本語:膠着語。
        形態素解析:文を文の最小構成要素(形態素)へ分割。品詞付与、原形の導出を行う。
            → 難しい。にわにわにわにわとりがいる, Times flies like arrow
            →cabocha, mecabの紹介

    第三章 統語論と統語解析(伊藤担当)
        文脈自由文法(Context Free Grammer )
          文法規則、非終端単語、
終端記号、開始記号から構成
            構文木, latticeの生成。
        
→最長一致法、最小形態素数選択方法
        →単語コスト、連接可能行列、連接コスト…
        →ビタビ・アルゴリズム
        →縦型・横型―ボトムアップ・トップダウン探索
       格文法・格フレーム(Case, Case Pharase)
            格・・・深層格(deep case)・表層格(surface case)

            チョムスキー、フィルモア






























Comments