基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
图像描述是使用计算机将一副图像中的内容使用自然语言的形式重新表达,是图像理解任务中极具挑战性的工作.目前,使用深度CNN模型和RNN模型对图像进行编码和解码框架来解决该问题已经成为研究热点,也在多个数据集上取得了突破.但这些工作在使用CNN的过程中对其参数优化不足,且常使用分阶段训练的方式,导致整个系统易陷入局部最优.针对这些问题,在GoogLeNet模型的基础上,利用其中间特征,自底向上添加了两个辅助LSTM分支及其监督函数,通过联合训练,对整个模型进行优化,保证了CNN模型低层参数对任务的有效性,避免了系统陷入局部最优点;同时,由于加入了低层监督函数的干扰,使得模型有了额外的正则化,提高了模型的泛化能力.在Flickr8K和Flickr30K两个数据集上的实验表明,本文方法优势明显,在多个统计指标上均超过了现有其他方法.
推荐文章
PDPSO优化多阶段AR-PCA间歇过程监测方法
间歇过程
种群多样性
粒子群优化
仿射传播聚类
自回归主元分析
多阶段因果复合期权定价方法
多阶段
因果复合期权
偏微分方程
基于双近邻标准化和PCA的多阶段过程故障检测
多阶段
故障检测
模型
主元分析
过程控制
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于GoogLeNet多阶段连带优化的图像描述
来源期刊 井冈山大学学报(自然科学版) 学科 工学
关键词 图像描述 GoogLeNet LSTM 多阶段 连带优化
年,卷(期) 2016,(5) 所属期刊栏目 信息科学
研究方向 页码范围 47-57
页数 11页 分类号 TP391.4
字数 7174字 语种 中文
DOI 10.3969/j.issn.1674-8085.2016.05.010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 谭云兰 井冈山大学流域生态与地理环境监测国家测绘地理信息局重点实验室 11 128 7.0 11.0
10 汤鹏杰 井冈山大学数理学院 11 64 4.0 7.0
19 许恺晟 同济大学计算机科学与技术系 1 7 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (5)
节点文献
引证文献  (7)
同被引文献  (3)
二级引证文献  (0)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(3)
  • 引证文献(3)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
图像描述
GoogLeNet
LSTM
多阶段
连带优化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
井冈山大学学报(自然科学版)
双月刊
1674-8085
36-1309/N
大16开
江西省吉安市青原区
2010
chi
出版文献量(篇)
2946
总下载数(次)
3
论文1v1指导