相田 太一‎ > ‎文献紹介‎ > ‎

2019/07/03

論文:Is Word Segmentation Necessary for Deep Learning of Chinese Representations?
担当:多田さん

単語分布のまばらさ?:vocabにおいてスパースであること、分散表現が上手く学習できていないのかも
単語分割が上手くいっていないのか、単語分割が必要ないのか?:わからない
文字分割はそもそも扱う語数が少ないため、有利なのかも
LMの条件が揃っていないのかも
他ドメインでの比較で、charのOOVが40%を超えているのにAccuracyが67%と高いのはなぜ?:わからない。触れられていない。


論文:
担当:相田

Comments