論文:Context-Aware Cross-Lingual Mapping 担当:多田さん 直交性の制約:ペアワイズ距離が保持。特異値分解で解を求める。 Mappingするには、対訳データが必要。 fasttextは安定していた。 ELMoのすごさをアピール。文脈を反映しているから良い。 論文:Simple Unsupervised Keyphrase Extraction using Sentence Embeddings 担当:丸山さん 全体として(取り出したn個のキーフレーズの集合を)見て、いいかどうか。似ているものが重なっていないと"全体として"よく見える。 positional bias:位置を0〜1にして掛け算 precisionは下がるのはわかるが、recallが下がるのは?:離れたところから取りすぎ? 何をもって"良い"?:文書を見せて、キーフレーズに色がついている状態。キーフレーズだけを見て、どれだけ意味がわかるか?という評価らしい。 筆者らはF値だけではキーフレーズの集合を評価できないのでは?という疑問で終わった。 なぜ学習時にキーフレーズの情報を用いないのに、キーフレーズをもってこれるのか?:文書のベクトルに近いものをもってこれるようにしたからかも。 全部の単語上からキーフレーズを出せるようにすれば、キーフレーズのない文書に対応できるのでは? |