機械学習

ナイーブベイズ分類器について


 ナイーブベイズ分類器で学習目的とするのは
   "この単語wが出現している(いない) から この文書dはクラスcである確率が高い"
 ということを言いたいので、
   "クラスcである文書dにはどのような単語wが出現しているか"
  つまり
   "文章dがクラスcである確率P(c)"
               と
    "クラスcの文書dに単語wが含まれる確率P(w|c)"
  を訓練データから学習する。(ベイズの定理から上の値が求まれれば、単語wが出現した(しなかった)から、このクラスになるだろうという確率P(c|w)が求まる。)

  多変数ベルヌーイモデルではこの確率を1文書辺りの単語の出現回数に影響されず、あるないだけで判断する。
 多項モデルでは、1文書辺りに単語の出現回数も考慮する。


 以下 理論的内容。
・多変数ベルヌーイモデル
      


・多項モデル

SVM(Support Vector Machine)      
Comments