1st Week - 2013.01.08



##導入
    ・3月までは、ゼミに関しては自然言語処理に関する勉強内容とする
        文献を読む(複数の文献)⇒まとめる
    ・分からないことは全部聞く
    ・事前にPDFは、誰でも読める環境を作っておく
        Slide Shareでも可
        もしくはゼミ前に先生前に提出するなど…
    ・研究に関しては自主的に別途時間を設ける。

##高橋「テキストマイニング」
    マイニング(発掘) ⇒ 情報の海から宝を発見する
    情報爆発;ビッグデータ(最近のはやり)
        ex)何百人のアンケートから統計的処理⇒傾向調査…
                自由記述欄⇒自然言語処理、テキストマイニング
            コールセンタ問い合わせ分析
            営業報告・不具合報告・ブログ分析

    テキストマイニングに使えるツール群
        形態素解析ツール … 形態素へ分解
            JUMAN … かな⇒漢字に直してくれる
            MeCab …
        構文解析ツール … 係り受けの解析 
            KNP     … よりリッチな情報を与えてくれる?
            CaboCha …
            コーパスとツールの相性:得意不得意
        固有表現抽出
            NExT, YamCha

    文書クラスタリング、文書分類 ⇒ 質問する
        文章クラスタリング
            k-近傍法:最も近いk個を同じクラスタとする
                     クラスタリング、分類でも使える
                     文書間の距離。
                     ユーグリッド距離のデザイン
                         単語の出現頻度

    テキストマイニングが使われる例
        情報検索とテキストマイニングの違い
            ゴールの明確の有無;(検索…対象がわかる。テキストマイニング:対象が分かってない)
            検索ワード ⇒ 形態素解析 ⇒ キーワード検索
        文書要約 … 重要文抽出と自由要約
        文書の質とは … 短くて意味・感情が正確に伝わるか

##伊藤:人工知能
    人工知能と人工無能
        人工無能(BOT, 決められた反応しかできない)
        境目は難しい
        脳を乗っける?
    
    現状は、人工知能に限りなく近い人工無能(Siri, 喋ってコンシェルジュ)
        ⇒言語処理を行ってキーワードを取り出している。
        ⇒キーワードと対応する答えが用意されている。
        ⇒これでも十分リアルに応答できてる…気がする

    ダジャレが言えるの日本人だけ
    意味解析、自動文生成。

    談話応答(Siri, 喋ってコンシェルジュ)
    マルコフ連鎖(JORI bot)
    パターンマッチング(Pattern Matching)

    チューニング問題;

    インスタントアシスタント
    音声認識と自然言語処理:
 

---






Comments