基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
大多数图像描述任务中每个单词的生成都依赖于图像全部信息和生成的上文信息,其中包括许多无关的图像信息,而且没有学习下文信息.为解决该问题,提出了一种双注意力机制,先使用上一次的图像显著信息与词向量一起预测当前的隐层状态,再使用当前的隐层状态预测当前图像显著信息.将双注意力机制与双向长短期记忆网络结合起来构成双向双注意力网络,并与卷积神经网络共同构成图像描述系统框架.该框架首先采用卷积神经网络提取图像特征,然后将图像特征输入到含有注意力机制的双向长短期记忆网络中,双向双注意力网络同时获取前向和后向的图像显著信息与隐层状态,产生图像描述.在数据集Flickr30k与MS COCO上进行模型训练与测试.结果表明,模型分别与只含有注意力机制和只含有双向循环神经网络模型相比,图像描述准确率获得了提高.
推荐文章
融入视觉常识和注意力的图像描述
图像描述
注意力机制
视觉常识
注意偏差
结合引导解码和视觉注意力的图像语义描述模型
图像描述
多示例学习
引导解码
视觉注意力机制
基于自注意力机制的方面情感分类
方面词
情感分类
自注意力机制
语义编码
基于注意力机制的全景分割网络
全景分割
背景类实例重叠
三重态注意力机制
语义增强注意力机制
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于双向注意力机制图像描述方法研究
来源期刊 测试技术学报 学科 工学
关键词 图像描述 注意力机制 双向长短期记忆网络 双注意力机制 双向双注意力网络
年,卷(期) 2019,(4) 所属期刊栏目 数据采集与图像处理
研究方向 页码范围 346-350,364
页数 6页 分类号 TP391.4
字数 2415字 语种 中文
DOI 10.3969/j.issn.1671-7449.2019.04.014
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张丽红 山西大学物理电子工程学院 44 191 8.0 12.0
2 陶云松 山西大学物理电子工程学院 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
图像描述
注意力机制
双向长短期记忆网络
双注意力机制
双向双注意力网络
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
测试技术学报
双月刊
1671-7449
14-1301/TP
大16开
太原13号信箱
22-14
1986
chi
出版文献量(篇)
2837
总下载数(次)
7
总被引数(次)
13975
论文1v1指导