教師なしマッピングによる言語横断テキスト分類

  1. 目的
    • 言語横断テキスト分類目的言語の文書をを原言語の文書が属する空間へと写像する必要
    • 機械翻訳システムの構築,コーパス、
      • コストが多大
    • 教師なしマッピング
  2. 手法
    • HSICとmaximize HSIC
    • トピック抽出
    • トピック間の対応付け
    • ラベルなし目的言語の文書
    • 教師なしマッピング
  3. 結果
    • 英語、フランス語、ドイツ語、日本語のレビュー文書を3つのカタログに分類する
    • 教師なしので、結果あまりよくない
    • ランダム(0.33)よりちょっと高く
    • でも、面白かった。
Comments