第五回

  • 松本さん「BLEU: a Method for Automatic Evaluation of Machine Translation
    • 機械翻訳の評価基準BLEUについて
      • ある一意の正解を用意して、その文と機械翻訳で得た文との親近性によって評価するもの
      • 単語、単語の位置、文の長さが全て正解と一致したら1になる
    • 勉強になったこと
      • T-検定・・・ある値とある値の差が微々たる差なのか?それとも大きな差なのか?
      • 平均の種類について様々な議論が行われました。
      • BLEUの評価はバイリンガルよりモノリンガルと似た評価が得られた。
      • BLEUは参照する訳が多いほうが評価が良い→翻訳器の評価の際は参照訳の数に注意!

  • 宮西「単語格子とマルコフモデルによる日本語機能表現の解析~日本語機能表現辞書「つつじ」を用いて~
    • 機能表現辞書つつじを使って機能表現の解析を行う
      • どこが機能表現なのか?
      • どういう意味で使われた機能表現なのか?
    • 解析の精度評価について
      • 精度と適合率の違いが式からよくわからない
    • 結論
      • 意味まで正しく検出するのは難しい
      • わかちがきで機能表現がくっついてでるというだけ(1つの機能表現としてまとまって出るだけ)でもありがたがられるのでは・・・
サブページ (1): 第五回(スライド)
Comments