題目 分散表現による読影レポートの類似文書検索 概要 医師支援のための類似医療文書検索とこのタスクでの分散表現の有用性を確認したい ・読影レポートをdoc2vecを用い学習 ・複雑な文書から、まず問題のシンプルにするため8つの疾病カテゴリを設定し、疾病が独立する様に文書を選定し評価用データとする ・評価用データ内の文書間の類似度を算出し、類似度上位文書にどれだけ同じカテゴリの文書を得られるかで評価 ・シンプルな評価データであるが、90%以上精度で類似文書を得ることができた ポスターは本ページ下部に添付 質問/アドバイス ・評価データへのアドバイス(文書を増やした方が良い、実タスクを考えると疾病カテゴリをより細かいカテゴリとした方が良いなど) ・他にも使える素性があれば、より良くなるのではないか、、、等 コメントをくださった皆様、本当にありがとうございました。 反省 最初の取り組みとして問題をシンプルにして取り組んだため、題目と少し離れてしまった感がある。次回は気をつけたい。 報告会資料 本ページ下部に添付 |