基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
视频的自动描述任务是计算机视觉领域的一个热点问题.视频描述语句的生成过程需要自然语言处理的知识,并且能够满足输入(视频帧序列)和输出(文本词序列)的长度可变.为此本文结合了最近机器翻译领域取得的进展,设计了基于编码-解码框架的双层LSTM模型.在实验过程中,本文基于构建深度学习框架时重要的表示学习思想,利用卷积神经网络(CNN)提取视频帧的特征向量作为序列转换模型的输入,并比较了不同特征提取方法下对双层LSTM视频描述模型的影响.实验结果表明,本文的模型具有学习序列知识并转化为文本表示的能力.
推荐文章
长短时记忆网络的自由体操视频自动描述方法
长短时记忆网络
注意力机制
自由体操
自动描述
MapReduce框架下基于正负关联规则的视频人物关系挖掘
视频人物关系
正负关联规则
人物关系细化
视频内容分析
视频版权证书与交易合约自动生成系统
版权证书
自动合约
哈希树
区块链
小波变换
基本特征值
一种视频数据驱动的水体表面模型生成方法
流体表面重建
高度场跳变
浅水波方程模拟
数据驱动
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 关系挖掘驱动的视频描述自动生成
来源期刊 南京信息工程大学学报 学科 工学
关键词 视频描述 LSTM模型 表示学习 特征嵌入
年,卷(期) 2017,(6) 所属期刊栏目 研究性论文
研究方向 页码范围 642-649
页数 8页 分类号 TP391.41|TP183
字数 5933字 语种 中文
DOI 10.13878/j.cnki.jnuist.2017.06.008
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐常胜 中国科学院自动化研究所模式识别国家重点实验室 14 108 4.0 10.0
5 黄毅 中国科学院自动化研究所模式识别国家重点实验室 7 26 3.0 5.0
9 鲍秉坤 中国科学院自动化研究所模式识别国家重点实验室 3 28 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
视频描述
LSTM模型
表示学习
特征嵌入
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
南京信息工程大学学报
双月刊
1674-7070
32-1801/N
南京市宁六路219号
chi
出版文献量(篇)
1162
总下载数(次)
7
总被引数(次)
4849
相关基金
北京市自然科学基金
英文译名:Natural Science Foundation of Beijing Province
官方网址:http://210.76.125.39/zrjjh/zrjj/
项目类型:重大项目
学科类型:
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导