基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对图像语义描述方法中存在的图像特征信息提取不完全以及循环神经网络(RNN)产生的梯度消失问题,提出了一种基于多特征提取的图像语义描述算法.所构建模型由三个部分组成:卷积神经网络(CNN)用于图像特征提取,属性提取模型(ATT)用于图像属性提取,而双向长短时记忆(Bi-LSTM)网络用于单词预测.该模型通过提取图像属性信息来增强图像表示,从而精确描述图中事物,并且使用Bi-LSTM捕捉双向语义依赖,从而进行长期的视觉语言交互学习.首先,使用CNN和ATT分别提取图像全局特征与图像属性特征;其次,将两种特征信息输入到Bi-LSTM中生成能够反映图像内容的句子;最后,在Microsoft COCO Caption、Flickr8k和Flickr30k数据集上验证了所提出算法的有效性.实验结果表明,与m-RNN方法相比,所提出的算法在描述性能方面提高了6.8~11.6个百分点.所提算法能够有效地提高模型对图像的语义描述性能.
推荐文章
基于CCA的图像语义特征提取的分析与研究
图像语义
典型相关分析
局部二值模式
特征参数
特征融合
基于空间分层的医学图像特征提取算法
辅助诊断
阈值提取
图像空间
基于空间分层的医学图像特征提取算法
辅助诊断
阈值提取
图像空间
图像特征提取
基于多特征融合的图像语义标注
基于内容的图像检索
多特征融合
支持向量机
图像语义标注
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于多特征提取的图像语义描述算法
来源期刊 计算机应用 学科
关键词 图像语义描述 图像属性 双向长短时记忆网络 卷积神经网络 循环神经网络
年,卷(期) 2021,(6) 所属期刊栏目 人工智能|Artificial intelligence
研究方向 页码范围 1640-1646
页数 7页 分类号 TP391.41
字数 语种 中文
DOI 10.11772/j.issn.1001-9081.2020091439
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (1)
共引文献  (1)
参考文献  (7)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(3)
  • 参考文献(2)
  • 二级参考文献(1)
2019(4)
  • 参考文献(4)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
图像语义描述
图像属性
双向长短时记忆网络
卷积神经网络
循环神经网络
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导