基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为有效地通过语音识别抑郁状态,在将语音进行滤波、降采样等预处理后通过短时傅里叶变换成时频图,输入本文提出的DD-AudioNet(一种融合注意力机制与双向长短时记忆网络的卷积神经网络)进行训练,提取神经网络的瓶颈层向量作为深度学习特征,共128个,再加上声学、频域、停顿、Mel频率倒谱系数和色度5类常用特征共计563个,基于特征选择方法Lasso选择了 26个.用迁移学习方法CORAL拉近训练集和测试集的特征分布,最后通过逻辑回归、随机森林和XgBoost分别进行分类辨识.实验结果表明,本文通过高维度特征定义与选择,设计的DD-AudioNet提取的深度学习特征可有效提升基于语音的抑郁状态辨识能力.
推荐文章
采用长短时记忆网络的低资源语音识别方法
语音识别
低资源
长短时记忆
神经网络
融合宽残差和长短时记忆网络的动态手势识别研究
手势识别
3D卷积神经网络
长短时记忆网络
宽残差网络
长短时记忆网络的自由体操视频自动描述方法
长短时记忆网络
注意力机制
自由体操
自动描述
基于长短时记忆网络的仿真系统数据故障诊断方法
故障诊断
长短时网络
神经网络
数据分析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 融合注意力机制与双向长短时记忆网络的基于语音分析的抑郁识别方法
来源期刊 复旦学报(自然科学版) 学科 工学
关键词 抑郁症 语音处理 注意力机制 双向长短时记忆网络 迁移学习
年,卷(期) 2021,(6) 所属期刊栏目
研究方向 页码范围 733-739
页数 7页 分类号 TN912.16|TP399
字数 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
抑郁症
语音处理
注意力机制
双向长短时记忆网络
迁移学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
复旦学报(自然科学版)
双月刊
0427-7104
31-1330/N
16开
上海市邯郸路220号
4-193
1955
chi
出版文献量(篇)
2978
总下载数(次)
5
总被引数(次)
22578
论文1v1指导