watch: ML - 白板 01 | Frequentist vs Bayesian

Table of contents

先验概率

  • 标签的直观分布

  • 后验概率: 在某一事件先成立的条件下,标签的分布。

  • 假设已知玩不玩英雄联盟这件事情 (𝐘) 上的概率分布(先验)为:

    P(Y=玩)=0.6;P(Y=不玩)=0.4

    另外,已知性别 (𝐗) 分布(似然/类条件概率):玩LOL人群中:80%是男生,20%女生;不玩LOL的人中有:20%男生,80%女生,也就是:

    P(X=男性|Y=玩lol)=0.8,P(X=小姐姐|Y=玩lol)=0.2
    P(X=男性|Y=不玩lol)=0.2,P(X=小姐姐|Y=不玩lol)=0.8

    求:一个男生他玩LOL的概率(后验,它是在先观察到性别X事件发生后得到的)

    根据贝叶斯定理 P(Y|X)=(P(X|Y)⋅P(Y))/P(X), P(Y=玩 | X=男性) = P(X=男性|Y=玩)⋅P(Y=玩) / (P(X=男性|Y=玩)⋅P(Y=玩) + P(X=男性|Y=不玩)⋅P(Y=不玩))

  • 知乎用户V6oo4r 的评论: 先验概率是以全事件为背景下,A事件发生的概率: P(A|Ω).
    后验概率是以新事件B为背景下,A事件发生的概率: P(A|B).

    全事件一般是统计获得的,所以成为先验概率,没有做实验前的概率。
    新事件一般是实验,如试验B,此时的事件背景从全事件变成了B,该事件B可能对A的概率有影响,那么需要对A现在的概率进行一个修正,从P(A|Ω) 变成了 P(A|B),所以成 P(A|B) 为后验概率,也就是试验(事件B发生)之后的概率。 P(A|B)= P(B|A)⋅P(A|Ω)/P(B|Ω)

    例子来源:如何理解先验概率与后验概率-昌硕-知乎专栏

机器学习-白板推导系列(一)-开篇

频率派

参数θ可能不仅是一个,也可能是一组数

贝叶斯派

参数 θ 是随机变量,服从一种概率分布(先验分布)

贝叶斯定理把参数的先验分布和后验分布通过似然值联系起来,参数的后验分布= 似然x先验分布/在参数空间对样本数据积分。

参数估计的方法:MAP 最大后验估计

Built with Hugo
Theme Stack designed by Jimmy