ブール検索
- 最も単純な情報検索モデル
- ターム(索引にリストアップする用語)をAND,OR,NOT演算子で結んだブール式により
クエリ(要求)を表現し、この条件を満たす文書集合をシステムに出力させるもの。 - 各文書がクエリに適合するか否かを二値で判定し、検索結果を文書の集合として出力する集合検索の下位概念。
- 精度と再現率を用いて評価できる。
- 精度と再現率の両方が高ければ良いシステムであるが、一般に両者はトレードオフの関係にある。
精度(適合率)
- ごみの少なさ
- 検索された文書中にユーザーの求める文書がどの程度の割合で存在するかを表す指標
「精度」 = 「検索された文書中の該当文書の数」 ÷ 「検索された文書数」
再現率
- もれの少なさ
- ユーザーの求める文書がどの程度検索されるかを表す指標
「再現率」 = 「検索された文書中の該当文書の数」 ÷ 「全文書中の該当文書の数」
参考文献 言語処理学会(2009)『言語処理学事典』共立出版
長尾真、佐藤理史、黒橋禎夫、角田達彦(1996)『自然言語処理』岩波書店
|