首页 > 其他 > 详细

2.2 Multinomial variables多项变量的分布_PRML模式识别与机器学习读书笔记

时间:2014-02-18 15:48:49      阅读:556      评论:0      收藏:0      [点我收藏+]

2.2 Multinomial variables多项变量的分布

    考虑多项变量即K个互斥变量(可能取值),使用1-of-K方式表示为K维向量x,其中某个向量xk=1,且其他向量=0。例如某个变量发生,对应向量为x3,则x3=1 :

        bubuko.com,布布扣

    xk=1发生的概率为μk,那么x的分布为:

        bubuko.com,布布扣

    这里bubuko.com,布布扣,且bubuko.com,布布扣,该分布可以看作是Bernoulli分布多输出的普遍形式,很明显上式是归一化的normalized:

        bubuko.com,布布扣

        bubuko.com,布布扣

    考虑N个独立观测值 {x1,…,xN} 数据集D, 对应的似然函数:

        bubuko.com,布布扣

    其中:

        bubuko.com,布布扣

    代表xk=1在D中发生次数。这是都是该分布的完全统计sufficient statistics。

    2.29的限制条件是bubuko.com,布布扣,那么可以使用拉格朗日乘子法对lnp(D|μ),转换为最大化下式:

        bubuko.com,布布扣

    基于μk求导等于0,得到:

            bubuko.com,布布扣

    将该式代入bubuko.com,布布扣,有 λ=-N,由此我们得到μ的最大似然解:

            bubuko.com,布布扣

Multinomial distribution多项分布    

接下来我们考虑m1,m2,…,mK的联合分布,从2.29式,我们可以得到:

    bubuko.com,布布扣

这就是多项分布归一化系数:

        bubuko.com,布布扣

变量mk 受限于:

        bubuko.com,布布扣

2.21 The Dirichlet distribution

    引入2.34式的先验的相似分布,共轭先验的形式应该是:

                bubuko.com,布布扣

    这里,bubuko.com,布布扣,对于3维来说,由于受限于总和,自由变量只有二维,所以k维变量就被限制在k-1维空间。如下图,取值限于一个平面,可以将这个平面投影到二维平面:

    bubuko.com,布布扣

    

α1,…, αK 是分布的参数,α=(α1,…, αK)T,2.37式的归一化形式:

        bubuko.com,布布扣

    其中:

            bubuko.com,布布扣

    该分布就是Dirichlet distribution,该分布是连续多变量分布,是多变量普遍化的Beta分布。狄利克雷分布奠定了狄利克雷过程的基础,被广泛应用于自然语言处理特别是主题模型(topic model)的研究。下图是一个3变量分布:

bubuko.com,布布扣

    将先验2.38与相似函数2.34相乘,有:

        bubuko.com,布布扣

    看得出,后验同样是一个Dirichlet分布,归一化系数,得到后验:

        bubuko.com,布布扣

2.2 Multinomial variables多项变量的分布_PRML模式识别与机器学习读书笔记

原文:http://www.cnblogs.com/enJeffrey/p/3553756.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!