ドメインをまたいで類似度を計算できない場合について,オブジェクトの対応付けを行う → ドメイン内部でのデータの分布に着目 → e.g. 対訳辞書獲得の例など 2つのドメイン間の独立性を測る指標「HSIC」を最大化する手法がとられている オブジェクト間のマッチングではなく,ドメインからドメインへのマッピングを学習する → ドメイン間のデータ数の違いに対応する K次元空間どうしの相関が最大となるように片方の空間を回転 → 基底が1対1対応 教師なしマッピングによる言語横断テキスト分類 → NMFはクラスを考慮しないために,複数のクラスの側面を持つものだとうまく働かない. 分類結果自体は見たのか? → 見ていない 何かこれを追加したらうまくいきそう・・・というものはある? → パフォーマンスを上げるためには,Semi-supervisedがいいだろうが,それには注目していない マッピングできないものは逃がし口を作るといいと思うが,今回はどうしたのか → アルゴリズムをそのまま 今回は単に数が少ないからうまくいかなかった? → 結構計算が重かったのでこのような感じになっている 相関がとれてもマッチングはとれないのでは? → 相関を最大にするように回転すればきっとマッチングはいい 違うドメイン間で似たような類似度のものはあるのか → むりやり仮定している |