西山 浩気‎ > ‎文献紹介‎ > ‎

2018/06/19 Character-based Joint Segmentation and POS Tagging for Chinese using Bidirectional RNN CRF

概要
単語分割と品詞付与は自然言語処理において重要な基礎技術である. 単語分割を行う際は品詞情報が重要な特徴となるため, 同時推定を行うことで精度向上が見込める. 本稿ではRNN-CRFモデルを用いた文字ベースの推定モデルを提案する. 文字分散表現を3種類の手法で生成し, それらをアンサンブル学習させた結果が従来手法と比べ高い精度を示した. また, 複数ドメインでの比較においても高精度を示し, 未知語に対しても高いロバスト性があるという結果が得られた.

参考文献
Character-based Joint Segmentation and POS Tagging for Chinese using Bidirectional RNN CRF, Yan Shao and Christian Hardmeier and Jorg Tiedemann and Joakim Nivre, Proceedings of the The 8th International Joint Conference on Natural Language Processing, pages 173–183, Taipei, Taiwan, November 27 – December 1, 2017 

Comments