相田 太一‎ > ‎文献紹介‎ > ‎

2019/06/25

論文:Analyzing the Limitations of Cross-lingual Word Embedding Mappings
担当:稲岡さん

joint learning:対訳の情報を使っている
線形変換でマッピングできるか?:条件「構造が同じ場合」のみ
  • 構造が近いならmappingした結果はjointと同じくらいになるはず
  • jointの方が良かったため、「多言語間の単語埋め込みは構造的に同じではない」と言える
  • mappingは対訳コーパスを増やせば精度が上がるが、構造的類似性が低い・他の単語に近寄る ことから、頭打ちになるだろう
  • mappingが頭打ちになることから、jointの手法を作らないといけない
  • mappingにニューラルで非線形変換は使わない?:今回は線形変換だけで、一切触れていない
    • 非線形はドメイン外になると急に弱くなるから?
    • 普通に学習させようとすると、パラメータが多すぎる・線形の情報を生かせない から学習がうまくいかない?
  • 少ないデータでjoint < 大量のデータでmapping
  • mappingで難しいならjointでも難しいのかも

Comments