研究室‎ > ‎卒業生のみなさまへ‎ > ‎梶原 智之‎ > ‎B3ゼミ‎ > ‎第1回‎ > ‎

ブール検索

ブール検索

  • 最も単純な情報検索モデル
  • ターム(索引にリストアップする用語)をAND,OR,NOT演算子で結んだブール式により
    クエリ(要求)を表現し、この条件を満たす文書集合をシステムに出力させるもの。
  • 各文書がクエリに適合するか否かを二値で判定し、検索結果を文書の集合として出力する集合検索の下位概念。
  • 精度と再現率を用いて評価できる。
  • 精度と再現率の両方が高ければ良いシステムであるが、一般に両者はトレードオフの関係にある。

精度(適合率)

  • ごみの少なさ
  • 検索された文書中にユーザーの求める文書がどの程度の割合で存在するかを表す指標
「精度」 = 「検索された文書中の該当文書の数」 ÷ 「検索された文書数」

再現率

  • もれの少なさ
  • ユーザーの求める文書がどの程度検索されるかを表す指標
「再現率」 = 「検索された文書中の該当文書の数」 ÷ 「全文書中の該当文書の数」

参考文献
    言語処理学会(2009)『言語処理学事典』共立出版
    長尾真、佐藤理史、黒橋禎夫、角田達彦(1996)『自然言語処理』岩波書店


Comments