基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了解决图像密集字幕描述中感兴趣区域(Regions of interest,ROI)定位不准确与区域粗粒度描述问题,本文提出了一种基于深度卷积与全局特征的图像密集字幕描述算法,该算法采用残差网络与并行LSTM(Long Short Term Memory)网络的联合模型对存在的区域重叠定位和粗粒度描述细节信息不完整问题进一步改进.首先利用深度残差网络与Faster R-CNN(Faster R-Convolutional Neural Network)的RPN(Regional Proposal Network)层获取更精准区域边界框,以便避免区域标记重叠;然后将全局特征、局部特征和上下文特征信息分别输入并行LSTM网络且采用融合算子将三种不同输出整合以获得最终描述语句.通过在公开数据集上与两种主流算法对比表明本文模型具有一定优越性.
推荐文章
一种基于密集深度分离卷积的SAR图像水域分割算法
合成孔径雷达
水域分割
深度学习
密集分离卷积
特征提取
基于密集卷积神经网络的遥感飞机识别
密集卷积神经网络
目标识别
中心损失
联合监督
方向梯度直方图
多尺度密集时序卷积网络的单幅图像去雨方法
图像去雨
多尺度网络
卷积神经网络
密集卷积
残差网络
深度传播
基于深度卷积网络的特征融合图像检索方法
图像检索
深度学习
特征融合
深度卷积网络
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于深度卷积与全局特征的图像密集字幕描述
来源期刊 信号处理 学科 工学
关键词 密集字幕生成 并行长短时记忆网络 Faster R-CNN 感兴趣区域 特征融合
年,卷(期) 2020,(9) 所属期刊栏目 论文
研究方向 页码范围 1525-1532
页数 8页 分类号 TP391
字数 语种 中文
DOI 10.16798/j.issn.1003-0530.2020.09.018
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (33)
共引文献  (25)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(4)
  • 参考文献(1)
  • 二级参考文献(3)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(3)
  • 参考文献(0)
  • 二级参考文献(3)
2014(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(5)
  • 参考文献(0)
  • 二级参考文献(5)
2016(4)
  • 参考文献(0)
  • 二级参考文献(4)
2017(5)
  • 参考文献(0)
  • 二级参考文献(5)
2018(5)
  • 参考文献(2)
  • 二级参考文献(3)
2019(3)
  • 参考文献(3)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
密集字幕生成
并行长短时记忆网络
Faster R-CNN
感兴趣区域
特征融合
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信号处理
月刊
1003-0530
11-2406/TN
大16开
北京鼓楼西大街41号
18-143
1985
chi
出版文献量(篇)
5053
总下载数(次)
13
总被引数(次)
32728
论文1v1指导