基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
注意力机制和视频语义嵌入使得视频描述任务取得了显著的提升,为更好地利用时序动态特征和语义信息,提出一种基于X-Linear的语义嵌入视频描述算法(X-Linear Semantic Embedding Network,XLSNet).该算法以基于编码解码器网络为基础,使用X-Linear注意力模块对视频特征进行编码,该模块使用双线性池化来增加视频时序特征的高阶交互,最终提取丰富的时序动态特征;为充分利用视频语义信息,使用语义嵌入的GRU和X-Linear作为解码器对视频描述进行生成.为防止过拟合现象,对解码器的GRU使用了层归一化和变分Dropout.所提出的算法仅仅使用了视频帧特征,在公开视频描述数据集MSVD上取得了很好的效果.
推荐文章
基于本体描述的语义服务发现改进算法
语义发现
网络服务
改进算法
服务发现机制
基于特征描述子的视频对象分级分割和跟踪算法
视频对象
分割
跟踪
特征描述子
基于X264的嵌入式视频监控系统设计
嵌入式
视频采集
视频监控
操作系统移植
摄像头
基于语义和谱聚类的监理视频R树检索方法
土木工程监理视频
语义
谱聚类
R树
词向量
节点分裂
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于X-Linear和语义嵌入的视频描述算法
来源期刊 信息技术与网络安全 学科
关键词 视频描述 语义嵌入 X-Linear注意力 XLSNet
年,卷(期) 2021,(2) 所属期刊栏目 人工智能|Artificial Intelligence
研究方向 页码范围 45-51
页数 7页 分类号 TP183
字数 语种 中文
DOI 10.19358/j.issn.2096-5133.2021.02.008
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
视频描述
语义嵌入
X-Linear注意力
XLSNet
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息技术与网络安全
月刊
2096-5133
10-1543/TP
大16开
北京市海淀区清华东路25号(北京927信箱)
82-417
1982
chi
出版文献量(篇)
10909
总下载数(次)
33
总被引数(次)
35987
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导