初めに 近年増えてきたAmazonなどネット通販の検索方式は、品名、金額、年式などあらかじめ定められたものに限られている。そこで自然言語で自由に表現された検索クエリに適応する商品検索方式を提案し、作りました。 システムは商品のレビュー文書を検索しクエリに書いてあることと一致していれば、その商品はクエリに一致した商品とみなします。
クエリとレビューからの情報抽出 クエリからレビュー文書を検索するさい、クエリを「対象」「項目」「値」の3つの意味表現に変換する。これを「要求情報」とよぶ。 また商品レビューからも「対象」、「項目」、「値」の3つの項目を抽出しておく。これを「意見情報」と呼ぶ。
- 検索クエリ変換例:「画質が綺麗なプラズマテレビ」→(対象、項目、値)(プラズマテレビ、画質、綺麗)
意見情報への情報抽出 対象はレビューの対象を取ればいいので問題ない。 項目と値の抽出方法 レビューテキストでよく使われれる表現に
として出現する。これらは係り受け関係になってることが多いので パターンに基づいて4つの変換規則を作った。(PDFのp3、図4参照)
他に期待、願望、依頼を表す文(~して欲しい。とか)を削除 名詞、形容詞、動詞、副詞、接頭辞、接尾辞以外の品詞を除去する。 「方」、「こと」「もの」「思う」「考える」などを削除
クエリとレビューの適合性判定
商品スコアの計算 PFIDFの考え方を応用した感じで商品スコアを計算
- 要求情報に適合する意見情報が多く、かつ適合しにくい要求を満たす商品ほど、スコアが大きい。
実験 宿泊施設が提示する情報だけでは検索が難しいと思われる検索クエリ10件を作成し。 その検索結果上位10件が適合しているかで判定。精度86%
失敗した理由
- 要求に合致する意見が少なかった
- 要求と反対の意見を適合性が高いと勘違いした。
利用者は自分の条件と合致する商品の中でさらにいいものを探そうとすると思う。 上位10件だけでなく、条件に合う施設がすべて表示されてないかを示す実験結果を示すとよかったと思う。
|