遇到的疑惑
风险函数
经验风险最小化:
- 需要手动推导:模型是条件概率分布,损失函数是对数损失函数,则其经验风险最小化等价于极大似然函数。这里可以用逻辑回归举例
- 极大似然估计的一个思想:既然发生了,那么该事件出现的概率其实就是很大的,用已经发生的事件去估计
- 未知的参数相对更为准确(频率派)
结构风险最小化:
- 模型是条件概率分布,损失函数事对数损失函数,模型复杂度由模型的先验概率表示时。结构风险等价于最大后验概率估计
这一点没有太理解。。
- 相关链接:
先验分布是均匀分布的时候,MLE 等价于 MAP。
课后习题
如上公式(1) ,已经证明。