0 - 算法
给定如下数据集
$$T=\{(x_1,y_1),(x_2,y_2),\cdots,(x_N,y_N)\},$$
假设$X$有$J$维特征,且各维特征是独立分布的,$Y$有$K$种取值。则对于输入$x$,朴素贝叶斯算法的输出为
$$y=arg\max_{c_k}P(Y=c_k)\prod_j P(X^{(j)}=x^{(j)}|Y=c_k),j=1,\cdots,J,k=1,\cdots,K,$$
1 - 推导
朴素贝叶斯的基本公式为
$$P(B|A)=\frac{P(A|B)P(B)}{P(A)},$$
在数据集$T=\{(x_1,y_1),(x_2,y_2),\cdots,(x_N,y_N)\},$中,有如下几个公式成立
$$\begin{align} a+b \end{align}$$