首页 > Web开发 > 详细

Multi-Source Pointer Network

时间:2020-05-19 23:10:48      阅读:82      评论:0      收藏:0      [点我收藏+]

技术分享图片

 

 

原文链接:https://arxiv.org/abs/1808.06885

 

Task

亚马逊产品的标题往往很长,搜索页不能把产品题目显示清楚,从而影响顾客购买。

技术分享图片

 

 

在淘宝上对标题进行自动总结,以简短的方式显示出产品的关键信息。

技术分享图片

 

 

该项任务有两个限制:

1)不能引入与产品无关的信息——解决方法:使用指针网络直接复制

2)保留关键信息——解决方法:增加知识编码器(knowledge encoder),引入先验知识(品牌名等)

 

Model

模型如下图所示,编码器编码后,利用attention机制、知识编码器做出预测。

技术分享图片

 

注意力分布

标题编码器和知识编码器采用类似的方式编码,即通过输入层隐态和解码向量进行类似attention的计算,并经过softmax得到注意力分布。

技术分享图片

 

答案预测

第t步预测单词w的概率通过对两种注意力分布的加权和得到。

技术分享图片

 

 

其中决定知识编码与标题编码比例的参数λ由下式计算,即计算解码向量、前一步的预测,以及两种解码器的隐态对attention加权平均,分别做线性变换后通过非线性激活函数。

技术分享图片

 

 

 

Results

以下是产品标题总结的结果示例。本文的模型增加先验知识后达到了比较好的效果,超过了seq2seq、指针网络和指针生成网络。

技术分享图片

 

Multi-Source Pointer Network

原文:https://www.cnblogs.com/zkwang/p/12920137.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!