相田 太一‎ > ‎文献紹介‎ > ‎

2019/03/20

論文:Unsupervised Statistical Machine Translation
担当:勝田さん

Cross lingual mapping:辞書で対応づけされたものをできるだけ近づけるように。パラレル単位で辞書が必要。
n-gramを1つの単語と見て埋め込む。
τ:温度パラメータ。0に近づくほどhardmaxに近い関数になる。結局計算で消えてしまうのでは?
cos類似度をτで割ると?:softmaxだとsっぽいカーブになるが、τで割ることによって…?
MERT?:SMTの評価関数?Maximum Error Rate Train
同一言語で言い換え、誤り訂正もできそう。


Comments