第一回

  • 松本さん:Introduction to Machine Translation
    • 機械翻訳に関する英論文の内容を説明
    • 質問したこと(一部)
      • 人工知能分野と自然言語処理分野の関係
        →かぶっているところはもちろんあるけれど、何だか違う分野。
         自然言語処理は実際の文字が対象。
         人工知能はきれいに結果が出るものを用いてさらに上の階層を目指す、というイメージ・・・。
      • なぜバイリンガル(2ヵ国語翻訳)では一方向の翻訳が多いのか
        →例えば「日→英」ができたからと言って「英→日」ができるわけではなく、大きく違ってくる。
         ※統計的に学習してたらまた別だけど・・・
      • BLEUとNISTの違い
        →どちらも、絶対的な「答え」とどれだけ似ているかを表している。アルゴリズムというかアプローチ?が違うだけ。

  • 宮西:「課題の進捗報告」(スライドは内部のみ)
    • 先生からいただいた課題の進み具合を発表
      • 形態素解析器(ChaSen(UniDicとIPADicを用いた場合の2種類)とJUMANの合わせて3種類)
        による「形態素の区切り方の違い」を見る課題です。
    • いただいた 質問&意見(一部)
      • マルコフモデルとは
        →宿題です・・・。
      • UniDicの文字化け解消やcjuman(JUMANをPython内で呼び出して解析する)を入れるなど環境をちょこちょこ整える
      • NLTK・・・日本語コーパスが入っているし、アクセスも簡単。青空文庫ももしかしたら入っているかも・・・。
      • 英数字は全角・半角によって違う結果が出たりする
      • どの組み合わせが一番良いか
        →どんな文章を入れるかによって違う。面倒だけど切り替えるのが良い!

  • 次週まで
    • 松本さん:機械翻訳に関連する英論文を読む→内容を発表
    • 宮西:形態素解析モデルに関する論文を読む→内容を発表
Comments