・自然言語処理の基礎 第一章、第二章(高橋担当): 自然言語処理のイメージ: Siri, Google翻訳, 検索、データマイニング… 日本での自然言語処理の始まり:1978年(未だ40年程度の分野!) 日本語:膠着語。 形態素解析:文を文の最小構成要素(形態素)へ分割。品詞付与、原形の導出を行う。 → 難しい。にわにわにわにわとりがいる, Times flies like arrow 第三章 統語論と統語解析(伊藤担当): 文脈自由文法(Context Free Grammer ) 文法規則、非終端単語、終端記号、開始記号から構成 構文木, latticeの生成。 →最長一致法、最小形態素数選択方法 →単語コスト、連接可能行列、連接コスト… →ビタビ・アルゴリズム →縦型・横型―ボトムアップ・トップダウン探索 格文法・格フレーム(Case, Case Pharase) 格・・・深層格(deep case)・表層格(surface case) チョムスキー、フィルモア |