論文:Complexity-Weighted Loss and Diverse Reranking for Sentence Simplification 担当:稲岡さん
- 内容語の複雑さを考慮した損失関数
- 単語の複雑さ:単語の長さ、音節、頻度。+埋め込み。単語の複雑さを5段階で人手評価したコーパスを使用(4:元の記事〜 0:平易)。
- 得られた「単語の複雑さ」で重みづけ。平易な単語ほど重みが大きくなる。
- ビームサーチはタイムステップと共に後ろの方が支配的になる(先行研究)
- 「平易さ」はない方がいい?:SARIによる結果ではそう。なぜかは書いていない。
- 2レベル、3レベル離れた時の違い?:理屈上2レベル、3レベル離れた時の実験はできるが、データが少なくなるためやっていない。
論文:Biomedical Document Retrieval for Clinical Decision Support System 担当:多田さん
- 医療分野でも文書検索、ランク付けをしたい。
- 3つの手法を提案。それぞれ独立して実験。
- 人手で評価し、クエリを拡張したものが自動拡張より強い。
- ベースラインのBM25は単語単位でみる。
- ランク付けは、既存のBM25でもいいのかも。
|