ナイーブベイズ分類器について
ナイーブベイズ分類器で学習目的とするのは "この単語wが出現している(いない) から この文書dはクラスcである確率が高い" ということを言いたいので、 "クラスcである文書dにはどのような単語wが出現しているか" つまり "文章dがクラスcである確率P(c)" と "クラスcの文書dに単語wが含まれる確率P(w|c)" を訓練データから学習する。(ベイズの定理から上の値が求まれれば、単語wが出現した(しなかった)から、このクラスになるだろうという確率P(c|w)が求まる。)
多変数ベルヌーイモデルではこの確率を1文書辺りの単語の出現回数に影響されず、あるかないだけで判断する。 多項モデルでは、1文書辺りに単語の出現回数も考慮する。
以下 理論的内容。 ・多変数ベルヌーイモデル ・多項モデル SVM(Support Vector Machine) |