西山 浩気‎ > ‎文献紹介‎ > ‎

2017/08/02 Neural Network Language Model for Chinese Pinyin Input Method Engine

概要
 IME(Input Method Editor)はコンピュータを利用する人であれば、誰もが常に利用している機能である。中国語においては通常Pinyinを用いて変換を行う。しかし、約500種類のPinyinを約6,000種類の中国語に変換する際には曖昧性が生じる。そこで、従来のN-gram言語モデルの代わりにNeural Network(NN)を利用することで性能向上を目指す。NNは出力に時間がかかるためIMEに向かないが、N-gramモデルの確率を予めNNで計算させることで実行時間をN-gram言語モデルと同程度に抑えながら、IMEとしての性能を向上させた。

参考文献
Neural Network Language Model for Chinese Pinyin Input Method Engine,Shien-Yuan Chen, Rui Wang, Hai Zhao, 29th Pacific Asia Conference on Language, Information and Computation pages 455 – 461, Shanghai, China, 10.30-11.1, 2015

発表スライド[URL]
Comments