原文服务方: 微电子学与计算机       
摘要:
为高效提取视频时空特征以提高视频预测准确性,提出了注意力时空解耦3D卷积LSTM算法.首先,将卷积LSTM内部单元的传统2D卷积运算改为3D卷积,额外提取视频帧间短期空间运动信息;并借助注意力机制自动捕捉视频帧间长期动态信息的相关性.其次,由于卷积LSTM网络中特征信息在所有层的Z型传递方式会导致梯度消失,为此在网络结构中加入层间高速通道优化不同层间LSTM单元视频信息流的传递过程.同时,时间特征和空间特征在网络中会彼此干扰学习冗余功能,造成特征信息的低效获取以及网络预测质量的降低,为此在损失函数中加入时空解耦运算分离时间特征和空间特征的学习.最后,针对训练编码阶段和预测解码阶段的数据输入过程,提出数据输入重采样,在模型训练和预测阶段使用相近相反的数据输入策略减少编码器和解码器的差异.在合成数据集以及人体动作数据库上的实验结果表明,该算法模型在时空特征提取上有更好的性能.
推荐文章
基于3D卷积神经网络的视频哈希算法
深度学习
哈希算法
视频检索
基于深层注意力的LSTM的特定主题情感分析
特定主题情感分析
深层注意力
LSTM
深度学习
自然语言处理
基于工厂数据的注意力LSTM网络辨识方法
化工过程建模
系统辨识
非线性动态模型
长短时记忆
数字化虚拟装置
基于注意力机制的LSTM的语义关系抽取
文本信息
语义关系
关系抽取
LSTM
注意力机制
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于注意力时空解耦3D卷积LSTM的视频预测
来源期刊 微电子学与计算机 学科 工学
关键词 视频预测 卷积LSTM 注意力机制 时空解耦 重采样
年,卷(期) 2023,(9) 所属期刊栏目 图像处理
研究方向 页码范围 63-72
页数 9页 分类号 TP311.2
字数 语种 中文
DOI 10.19304/J.ISSN1000-7180.2022.0023
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2023(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
视频预测
卷积LSTM
注意力机制
时空解耦
重采样
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
微电子学与计算机
月刊
1000-7180
61-1123/TN
大16开
1972-01-01
chi
出版文献量(篇)
9826
总下载数(次)
0
总被引数(次)
59060
论文1v1指导