Table of contents
先验概率
-
标签的直观分布
-
后验概率: 在某一事件先成立的条件下,标签的分布。
-
假设已知玩不玩英雄联盟这件事情 (𝐘) 上的概率分布(先验)为:
P(Y=玩)=0.6;P(Y=不玩)=0.4
另外,已知性别 (𝐗) 分布(似然/类条件概率):玩LOL人群中:80%是男生,20%女生;不玩LOL的人中有:20%男生,80%女生,也就是:
P(X=男性|Y=玩lol)=0.8,P(X=小姐姐|Y=玩lol)=0.2
P(X=男性|Y=不玩lol)=0.2,P(X=小姐姐|Y=不玩lol)=0.8求:一个男生他玩LOL的概率(后验,它是在先观察到性别X事件发生后得到的)
根据贝叶斯定理 P(Y|X)=(P(X|Y)⋅P(Y))/P(X), P(Y=玩 | X=男性) = P(X=男性|Y=玩)⋅P(Y=玩) / (P(X=男性|Y=玩)⋅P(Y=玩) + P(X=男性|Y=不玩)⋅P(Y=不玩))
-
知乎用户V6oo4r 的评论: 先验概率是以全事件为背景下,A事件发生的概率: P(A|Ω).
后验概率是以新事件B为背景下,A事件发生的概率: P(A|B).全事件一般是统计获得的,所以成为先验概率,没有做实验前的概率。
新事件一般是实验,如试验B,此时的事件背景从全事件变成了B,该事件B可能对A的概率有影响,那么需要对A现在的概率进行一个修正,从P(A|Ω) 变成了 P(A|B),所以成 P(A|B) 为后验概率,也就是试验(事件B发生)之后的概率。 P(A|B)= P(B|A)⋅P(A|Ω)/P(B|Ω)
频率派
参数θ可能不仅是一个,也可能是一组数
贝叶斯派
参数 θ 是随机变量,服从一种概率分布(先验分布)
贝叶斯定理把参数的先验分布和后验分布通过似然值联系起来,参数的后验分布= 似然x先验分布/在参数空间对样本数据积分。
参数估计的方法:MAP 最大后验估计