基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
特种视频(本文特指暴力视频)的智能分类技术有助于实现网络信息内容安全的智能监控.针对现有特种视频多模态特征融合时未考虑语义一致性等问题,本文提出了一种基于音视频多模态特征融合与多任务学习的特种视频识别方法.首先,提取特种视频的表观信息和运动信息随时空变化的视觉语义特征及音频信息语义特征;然后,构建具有语义保持的共享特征子空间,以实现音视频多种模态特征的融合;最后,提出基于音视频特征的语义一致性度量和特种视频分类的多任务学习特种视频分类理论框架,设计了对应的损失函数,实现了端到端的特种视频智能识别.实验结果表明,本文提出的算法在Violent Flow和MediaEval VSD 2015两个数据集上平均精度分别为97.97%和39.76%,优于已有研究.结果 证明了该算法的有效性,有助于提升特种视频监控的智能化水平.
推荐文章
基于多特征距离学习的视频分类
视频检索
视频分类
距离学习
一种用于供电服务评估的多模态多任务框架
多模态
多任务
情感分析
诉求分类
神经网络
多任务运动想象脑电特征的融合分类研究
脑机接口
运动想象
特征提取和分类
小波变换
共空间模式
支持向量机
基于多任务学习的多源数据分类研究
多源学习
多分类
任务相关性
多任务学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 多模态特征融合与多任务学习的特种视频分类
来源期刊 光学精密工程 学科 工学
关键词 特种视频识别 特征提取 多模态特征融合 语义一致性度量 多任务学习
年,卷(期) 2020,(5) 所属期刊栏目 信息科学
研究方向 页码范围 1177-1186
页数 10页 分类号 TP391.4
字数 7939字 语种 中文
DOI 10.3788/OPE.20202805.1177
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王生进 清华大学电子工程系 32 235 6.0 15.0
2 吴晓雨 中国传媒大学信息与通信工程学院 14 104 6.0 10.0
3 顾超男 中国传媒大学信息与通信工程学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (46)
共引文献  (11)
参考文献  (9)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(3)
  • 参考文献(1)
  • 二级参考文献(2)
2012(5)
  • 参考文献(0)
  • 二级参考文献(5)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(4)
  • 参考文献(1)
  • 二级参考文献(3)
2015(1)
  • 参考文献(0)
  • 二级参考文献(1)
2016(7)
  • 参考文献(1)
  • 二级参考文献(6)
2017(11)
  • 参考文献(1)
  • 二级参考文献(10)
2018(7)
  • 参考文献(1)
  • 二级参考文献(6)
2019(4)
  • 参考文献(4)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
特种视频识别
特征提取
多模态特征融合
语义一致性度量
多任务学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
光学精密工程
月刊
1004-924X
22-1198/TH
大16开
长春市东南湖大路3888号
12-166
1959
chi
出版文献量(篇)
6867
总下载数(次)
10
总被引数(次)
98767
论文1v1指导