作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目的 复杂环境下的疲劳驾驶检测是一个具有挑战性的技术问题.为了充分利用驾驶员面部特征信息与时间特征,提出一种基于伪3D(Pseudo-3D,P3D)卷积神经网络(convolutional neural network,CNN)与注意力机制的驾驶疲劳检测方法.方法 采用伪3D卷积模块进行时空特征学习;提出P3D-Attention模块,利用P3D的结构融合双通道注意力模块和适应的空间注意力模块,提高对重要通道特征的相关度,增加特征图的全局相关性,将多层深度卷积特征进行融合.利用双通道注意力模块分别在视频帧之间和每一帧的通道上施加关注,去除背景和噪声对识别的干扰,使用自适应空间注意模块使模型训练更快、收敛更好;使用2D全局平均池化层替代3D全局平均池化层获得更具表达能力的特征,进而提高网络收敛速度;运用softmax分类层进行分类.结果 在公共数据集YawDD(a yawning detection dataset)上开展对比实验,本文方法在测试集上的Fl-score检测准确率达到99.89%,在打哈欠类别上召回率达到100%;在数据集UTA-RLDD(University of Texas at Arlington real-life drowsiness dataset)上,本文方法在测试集上的F1-score检测准确率达到99.64%,在困倦类别上召回率达到100%;与Inception-V3融合LSTM(long short-term memory)的方法相比,本文方法模型大小为42.5 MB,是其模型大小的1/9,本文方法预测时间约660 ms,是其11%左右.结论 提出一种基于伪3D卷积神经网络与注意力机制的驾驶疲劳检测方法,利用注意力机制进一步分析哈欠、眨眼和头部特征运动,将哈欠行为与说话行为动作很好地区分开来.
推荐文章
一种基于卷积神经网络的疲劳驾驶检测方法
疲劳驾驶检测
人脸检测
人脸特征点
卷积神经网络
基于D-S理论和模糊神经网络的疲劳驾驶监测
疲劳驾驶
D-S证据理论
模糊神经网络
基于注意力时空解耦3D卷积LSTM的视频预测
视频预测
卷积LSTM
注意力机制
时空解耦
重采样
基于3D卷积神经网络的视频哈希算法
深度学习
哈希算法
视频检索
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 伪3D卷积神经网络与注意力机制结合的疲劳驾驶检测
来源期刊 中国图象图形学报 学科 工学
关键词 3D卷积神经网络 伪3D卷积 全局平均池化 注意力机制 疲劳驾驶
年,卷(期) 2021,(1) 所属期刊栏目 目标检测与跟踪
研究方向 页码范围 143-153
页数 11页 分类号 TP183|TP391.41
字数 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (10)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
3D卷积神经网络
伪3D卷积
全局平均池化
注意力机制
疲劳驾驶
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国图象图形学报
月刊
1006-8961
11-3758/TB
大16开
北京9718信箱
82-831
1996
chi
出版文献量(篇)
5906
总下载数(次)
17
总被引数(次)
131816
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导