基本方法
朴素贝叶斯的两个基础:
- 贝叶斯定理
- 假设特征条件独立
给定数据集 $T$ :
由 $P(X,Y)$ 独立同分布生成。
那么条件概率分布是:
因为我们假设特征条件是独立的,那么可以得到:
基础有了,现在对于我们一个给定的 $x$ ,我们可以通过贝叶斯定理去计算其后验概率分布,将后验分布最大值对应的类作为 $x$ 的类输出:
相应地,公式带入一下,同时我们可以知道 $P(X=x)$ 是一个定值,其不会影响最后的结果,那么:
相应地,分类结果为:
朴素贝叶斯法的参数估计
可以使用极大似然估计,具体地:
其中 $X{j}$ 是 $x$ 的第 $j$ 个特征, $a{jl}$ 是 $x_{j}$ 第 $l$ 个可能取得的值。
贝叶斯估计
作用:解决极大似然估计可能出现的概率为 0 的情况。
公式如下:
其中 $\lambda >= 0$ ,等价于在随机变量的各个取值的频数上加一个正数,其中 $S_{j}$ 是该特征变量的可能取值数。读起来有点 $Beta$ 分布的感觉。
同理:
其中 $K$ 为 $Y$ 可能的取值数。
总结
朴素贝叶斯法最应理解的还是条件独立性 这一点,让计算方便了许多。