相田 太一‎ > ‎文献紹介‎ > ‎

2019/04/23

論文:Complexity-Weighted Loss and Diverse Reranking for Sentence Simplification
担当:稲岡さん

  • 内容語の複雑さを考慮した損失関数
    • 単語の複雑さ:単語の長さ、音節、頻度。+埋め込み。単語の複雑さを5段階で人手評価したコーパスを使用(4:元の記事〜 0:平易)。
    • 得られた「単語の複雑さ」で重みづけ。平易な単語ほど重みが大きくなる。
  • ビームサーチはタイムステップと共に後ろの方が支配的になる(先行研究)
    • 選ばれた順位を足して回避する。
  • 「平易さ」はない方がいい?:SARIによる結果ではそう。なぜかは書いていない。
  • 2レベル、3レベル離れた時の違い?:理屈上2レベル、3レベル離れた時の実験はできるが、データが少なくなるためやっていない。


論文:Biomedical Document Retrieval for Clinical Decision Support System
担当:多田さん

  • 医療分野でも文書検索、ランク付けをしたい。
  • 3つの手法を提案。それぞれ独立して実験。
    • 既存の手法、ツールを医療分野に適用してみた感じ。
  • 人手で評価し、クエリを拡張したものが自動拡張より強い。
  • ベースラインのBM25は単語単位でみる。
  • ランク付けは、既存のBM25でもいいのかも。

Comments