ch4-朴素贝叶斯

基本方法

朴素贝叶斯的两个基础:

  • 贝叶斯定理
  • 假设特征条件独立

给定数据集 $T$ :

由 $P(X,Y)$ 独立同分布生成。

那么条件概率分布是:

因为我们假设特征条件是独立的,那么可以得到:

基础有了,现在对于我们一个给定的 $x$ ,我们可以通过贝叶斯定理去计算其后验概率分布,将后验分布最大值对应的类作为 $x$ 的类输出:

相应地,公式带入一下,同时我们可以知道 $P(X=x)$ 是一个定值,其不会影响最后的结果,那么:

相应地,分类结果为:

朴素贝叶斯法的参数估计

可以使用极大似然估计,具体地:

其中 $X{j}$ 是 $x$ 的第 $j$ 个特征, $a{jl}$ 是 $x_{j}$ 第 $l$ 个可能取得的值。

贝叶斯估计

作用:解决极大似然估计可能出现的概率为 0 的情况。

公式如下:

其中 $\lambda >= 0$ ,等价于在随机变量的各个取值的频数上加一个正数,其中 $S_{j}$ 是该特征变量的可能取值数。读起来有点 $Beta$ 分布的感觉。

同理:

其中 $K$ 为 $Y$ 可能的取值数。

总结

朴素贝叶斯法最应理解的还是条件独立性 这一点,让计算方便了许多。