自然言語処理研究室 B3ゼミ 第05回 ============================== last update:2014-02-05 発表スライド --------------- 高橋 - コーパスについて 2nd + 論文紹介「自然言語処理の再挑戦~統計的自然言語処理を超えて~」 --------------- コーパスの作成 コーパスの設計…母集団 データの電子化…書式,文字コードの統一 データのアノテーション 品詞タグ付け(英語,日本語),形態素解析(日本語) コーヒーブレイク…人間の文字認識(最初と最後があってれば認識できる) 論文紹介「自然言語処理の再挑戦~統計的自然言語処理を超えて~」 言語処理はラベル付問題 辞書とコーパス IPADIC辞書, 大規模テキストデータ 言語解析ツール ChaSen, JUMAN, MeCab, CaboCha こっちの研究室では,MeCabメイン 宮西さん⇒形態素解析ツール(MeCabベース) それぞれの特性とは? コーパスの作成・管理ツール * 接尾辞配列…高速なテキスト検索…似たイメージ LCPを利用する事でO(n^2logn)⇒O(nlogn) 高速文字列解析の世界…岡野原大輔 Chaki…表で解析結果分析できる. 係り受けの分析結果を表示できる便利ツール 単語の共起,N-gram単語の分析できる. ラベル付与. 後藤 - オントロジーの構築の考え方と指針 --------------- * クラス分類の基準の同一性 子の性質は親と同じ性質である. * インスタンス集合のパーティション性 インスタンス集合が独立 かつ その和集合 = パーティション * クラスは本質属性を持っている 固定性 … インスタンスごとに変わらない 非外部依存性 … 色,数値の違い 唯一性 … 例外ある(馬,二輪車・四輪車) ロール クラス分類 ロール概念, ロールホルダー ,基本概念 インスタンスモデル ロール・関係概念理論に基づく… 古崎 伊藤 - 質問応答の歴史(1) --------------- システム例: Baseball(1970): 疑問文型の定型表現から⇒場所 YES,NOかデータ表示するだけ SHRDLU: 積み木の構文の曖昧性. QUALM(1977): 一般的背景知識を持ってる? 質問応答するための自然言語インターフェース 1.構文解析 2.意味解析 3.論理形式や中間的な意味表現に変換 4.知識照応 |