##導入 ・3月までは、ゼミに関しては自然言語処理に関する勉強内容とする 文献を読む(複数の文献)⇒まとめる ・分からないことは全部聞く ・事前にPDFは、誰でも読める環境を作っておく Slide Shareでも可 もしくはゼミ前に先生前に提出するなど… ・研究に関しては自主的に別途時間を設ける。 ##高橋「テキストマイニング」 マイニング(発掘) ⇒ 情報の海から宝を発見する 情報爆発;ビッグデータ(最近のはやり) ex)何百人のアンケートから統計的処理⇒傾向調査… 自由記述欄⇒自然言語処理、テキストマイニング コールセンタ問い合わせ分析 営業報告・不具合報告・ブログ分析 テキストマイニングに使えるツール群 形態素解析ツール … 形態素へ分解 JUMAN … かな⇒漢字に直してくれる MeCab … 構文解析ツール … 係り受けの解析 KNP … よりリッチな情報を与えてくれる? CaboCha … コーパスとツールの相性:得意不得意 固有表現抽出 NExT, YamCha 文書クラスタリング、文書分類 ⇒ 質問する 文章クラスタリング k-近傍法:最も近いk個を同じクラスタとする クラスタリング、分類でも使える 文書間の距離。 ユーグリッド距離のデザイン 単語の出現頻度 テキストマイニングが使われる例 情報検索とテキストマイニングの違い ゴールの明確の有無;(検索…対象がわかる。テキストマイニング:対象が分かってない) 検索ワード ⇒ 形態素解析 ⇒ キーワード検索 文書要約 … 重要文抽出と自由要約 文書の質とは … 短くて意味・感情が正確に伝わるか ##伊藤:人工知能 人工知能と人工無能 人工無能(BOT, 決められた反応しかできない) 境目は難しい 脳を乗っける? 現状は、人工知能に限りなく近い人工無能(Siri, 喋ってコンシェルジュ) ⇒言語処理を行ってキーワードを取り出している。 ⇒キーワードと対応する答えが用意されている。 ⇒これでも十分リアルに応答できてる…気がする ダジャレが言えるの日本人だけ 意味解析、自動文生成。 談話応答(Siri, 喋ってコンシェルジュ) マルコフ連鎖(JORI bot) パターンマッチング(Pattern Matching) チューニング問題; インスタントアシスタント 音声認識と自然言語処理: --- |