MAP examples

2连咸饼 ➔ P(袋子)

从同一袋子里连续取出了2个咸饼干,问最有可能是以下5个袋子中的哪个?

饼干比例: 100%甜 75%甜25%咸 50%甜50%咸 25%甜75%咸 100%咸
MLE 0 0.0625 0.25 0.5625 1

设从每个袋子中取出咸饼干的概率是p,则MLE 只需对每个袋子求p²,则第5个袋子的似然最大。而MAP还要考虑各袋子出现的概率g,所以MAP函数为 p²×g,可得第4个袋子的后验最大

先验g (袋子出现的概率) 0.1 0.2 0.4 0.2 0.1
袋中咸饼干比例 θ 0 0.25 0.5 0.75 1
事件 X:二连咸(MLE) 0 0.0625 0.25 0.5625 1
MAP 0 0.0125 0.1 0.1125 0.1
后验 0 3.85% 30.8% 34.6% 30.8%

因为这里的样本空间由两个随机变量组成:事件X和袋子概率g,所以P(X)就是在所有θ可能的情况下X发生的概率和(0.325)。因为P(X)是个常数,所以做 MAP 只看分子就行。

男生 ➔ P(打lol)

一个男生,求他打lol的概率

先验g 60% 40%
男女比例 θ 80%男20%女 20%男80%女
事件X:1男 (MLE) 0.8 0.2
事件X:1男 (MAP) 0.48 0.08
后验 85.7% 14.3%

9正1反 ➔ P(硬币)

抛10次硬币9正1反,求这枚硬币朝上的概率? 【机器学习我到底在学什么】哲学角度聊聊贝叶斯派和频率派,数学角度看看极大似然估计和最大后验估计

频率派会说是0.9,因为这样对应"抛出9次朝上"的概率最大; 贝叶斯派依据贝叶斯公式,带入先验概率和实验结果,认为向上概率落在 0.5~0.9 之间的概率最大: 比如参数θ’=0.5 的先验概率是 P(θ’)=0.8, 把θ’=0.5 带入二项分布可算出事件9正1反发生的概率:P(X|θ’)=C₉¹⁰⋅(0.5)⁹⋅(0.5)¹=0.00976. 所以贝叶斯公式的分子=0.8×0.00976=0.00781。 而分母 P(X) 应为 θ 从0取到1时,各种0对应的事件X:9正1反发生的似然之和,但从0到1 是不可数的,无法得到解析解,可以做数值模拟。下面的例子只假设样本空间只有 3 中参数θ 的取值:0.5, 0.9, 0.4。

先验 g 80% 1% 19%
参数 θ 50%上50%下 90%上10%下 40%上60%下
事件 X C₉¹⁰⋅(0.5)⁹⋅(0.5)¹ C₉¹⁰(0.9)⁹(0.1)¹ C₉¹⁰(0.4)⁹(0.9)¹
MLE 0.00976 0.387 0.00236
MAP 0.00781 0.00387 0.000448
后验 64.4% 31.9% 3.7%

上表中 MLE = P(X|θ), MAP = P(X|θ)P(θ), 而“事件X发生,参数取到θ的概率”: P(θ|X) = MAP/P(X),其中 P(X) 是事件X在样本空间中发生的概率,应为当参数取各种 θ 时,事件X 发生的条件概率 之和,也就是各种θ 对应的 MAP 求和。

感觉不太恰当

甲地下雨了,求乙地下雨概率 条件概率 例题

特征 ➔ P(嫁)

数据挖掘实验-Naive Bayes