首页 > 其他 > 详细

2018 经典的CVPR 关于ImageCaptioning论文

时间:2019-12-22 16:49:21      阅读:125      评论:0      收藏:0      [点我收藏+]

1.        SemStyle: Learning to Generate Stylised Image Captions using Unaligned Text(2018 CVPR)

主要研究方向:本论文主要是做语言风格,就是对同一张图片有多种描述。

 

 技术分享图片

 

 技术分享图片

 

 

 2.        Neural Baby Talk2018 cvpr

主要研究内容:对于图片的描述更多的应该是基于图像内容,而不是基于语言模型去推理;如果是非常见场景,那么模型就差强人意。

技术分享图片

 

 

 3.        Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering2018 CVPR

主要研究内容:针对attention之前输入的是均等化图片格子,而不是具体的如同人眼观察到的图像内容,故而本论文是先用faster-RCNN检测得到feature map,而后对其加权,再进行转化为自然语言。

技术分享图片

 

 

4.        GroupCap: Group-based Image Captioning with Structured Relevance and Diversity Constraints

主要研究方向:目前大部分的图像描述模型都是集中在一张图像上,也就是一次给一张图像做字幕生成,本论文是给定多张图片来使caption更加具体。

数据集http://mac.xmu.edu.cn/Data_cvpr18.html (基于MSCOCO更改而成)

 技术分享图片

 

 

 5.        Image Caption Generation with Hierarchical Contextual Visual Spatial Attention

主要研究方向:这里提出的注意力机制考虑了图片region之间的上下文。

 技术分享图片

 

 

 

2018 经典的CVPR 关于ImageCaptioning论文

原文:https://www.cnblogs.com/AntonioSu/p/12080124.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!