首页 > 其他 > 详细

word2vec----hierarchical softmax

时间:2018-05-12 13:07:05      阅读:425      评论:0      收藏:0      [点我收藏+]

一、输出层结构

技术分享图片

注意到,huffman树的每一层,都有参数和激活函数sigmoid存在,实际上是一个神经网络。影响该节点的二分类走向。这和一般的多分类问题中,各种分类是同处于平等的最后一层,是不同的。

二、模型推导

我们重点关注输出层huffman树过程的模型推导。对于每个走到huffman树根节点的x,它要经过l次二分类,最终到达对应的标签,也是是根据上下文得到的词。因此,概率为多个二分类概率的连乘形式:

技术分享图片

 

对该概率值取对数,即得到损失函数。输出层含有大量参数,而且不同词因为分类时走的路径不同,所以对应的参数不完全相同。

 

word2vec----hierarchical softmax

原文:https://www.cnblogs.com/mimandehuanxue/p/9024164.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!