基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对计算机对视频进行自动标注和描述准确率不高的问题,提出一种基于多特征融合的深度视频自然语言描述的方法.该方法提取视频帧序列的空间特征、运动特征、视频特征,进行特征的融合,使用融合的特征训练基于长短期记忆(LSTM)的自然语言描述模型.通过不同的特征组合训练多个自然语言描述模型,在测试时再进行后期融合,即先选择一个模型获取当前输入的多个可能的输出,再使用其他模型计算当前输出的概率,对这些输出的概率进行加权求和,取概率最高的作为输出.此方法中的特征融合的方法包括前期融合:特征的拼接、不同特征对齐加权求和;后期融合:不同特征模型输出的概率的加权融合,使用前期融合的特征对已生成的LSTM模型进行微调.在标准测试集MSVD上进行实验,结果表明:融合不同类型的特征方法能够获得更高评测分值的提升;相同类型的特征融合的评测结果不会高于单个特征的分值;使用特征对预训练好的模型进行微调的方法效果较差.其中使用前期融合与后期融合相结合的方法生成的视频自然语言描述得到的METEOR评测分值为0.302,比目前查到的最高值高1.34%,表明该方法可以提升视频自动描述的准确性.
推荐文章
基于深度双向模型和特征融合的视频转文字研究
视频转文字
深度双向模型
哈尔特征
特征融合
卷积神经网络
基于Ontology的自然语言理解
KB-NLU
Ontology
世界知识型:词汇语义型
句法语义型
基于中文自然语言的纹理分类新方法
CBIR
纹理分类
自然语言
LSSVM
基于伪自然语言理解的知识获取系统
书本知识描述语言BL
知识编译
语义图
知识求精
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于多特征融合的深度视频自然语言描述方法
来源期刊 计算机应用 学科 工学
关键词 深度学习 特征融合 视频语义分析 视频描述 递归神经网络 长短时记忆
年,卷(期) 2017,(4) 所属期刊栏目 计算机视觉与虚拟现实
研究方向 页码范围 1179-1184
页数 6页 分类号 TP37|TP181
字数 6703字 语种 中文
DOI 10.11772/j.issn.1001-9081.2017.04.1179
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 朱清新 电子科技大学信息与软件工程学院 74 1042 16.0 30.0
2 牛新征 电子科技大学计算机科学与工程学院 45 470 10.0 20.0
3 梁锐 电子科技大学信息与软件工程学院 7 20 2.0 4.0
4 廖淑娇 电子科技大学信息与软件工程学院 2 11 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (18)
共引文献  (243)
参考文献  (1)
节点文献
引证文献  (9)
同被引文献  (14)
二级引证文献  (8)
1962(1)
  • 参考文献(0)
  • 二级参考文献(1)
1980(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(2)
  • 参考文献(0)
  • 二级参考文献(2)
2016(2)
  • 参考文献(1)
  • 二级参考文献(1)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(3)
  • 引证文献(3)
  • 二级引证文献(0)
2019(7)
  • 引证文献(4)
  • 二级引证文献(3)
2020(7)
  • 引证文献(2)
  • 二级引证文献(5)
研究主题发展历程
节点文献
深度学习
特征融合
视频语义分析
视频描述
递归神经网络
长短时记忆
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导