1.概率基础:
联合概率:包含多个条件,并且所有条件同时成立的概率。P(A,B)=P(A)*P(B);
条件概率:在事件B发生的条件下,事件A发生的概率。P(A|B)=P(AB)/P(B)=P(B|A)P(A)/P(B);
条件概率的特性:当AB相互独立时,P(A1,A2|B)=P(A1|B)P(A2|B)
2.朴素贝叶斯公式:
这里以文档预测给出,一篇文章可以分为一个个词组,判断这篇文章属于什么类型,就是依据词组在总文章中的概率大小。
W为给定的文章,Fn为文章中的不同词组,C为文章类别。W=F1+F2+F3......+Fn;
依据给定的文章和词语来预测这是一篇什么类型的文章。
P(C|W)=P(W|C)*P(C)/P(W)=P(F1,F2,F3......Fn|C)/P(F1,F2,F3......Fn);