原文服务方: 太原理工大学学报       
摘要:
[目的]针对传统声学特征所含情感信息不足的问题,提出一种基于多任务学习的深度特征提取模型优化声学特征,所提声学深度特征既能更好表征自身又拥有更多情感信息.[方法]基于声学特征与语谱图特征之间的互补性,首先通过卷积神经网络提取语谱图特征,然后使用多核主成分分析方法对这两个特征进行特征融合降维,所得融合特征可有效提升系统识别性能.[结果]在 EMODB 语音库与 CASIA 语音库上进行实验验证,当采用 DNN 分类器时,声学深度特征与语谱图特征的多核融合特征取得最高识别率为 92.71%、88.25%,相比直接拼接特征,识别率分别提升 2.43%、2.83%.
推荐文章
基于改进语音特征提取方法的语音识别
语音识别
特征提取
最大似然线性转换
Mel频率倒谱系数
隐马尔柯夫模型
基于深度信念网络的语音情感识别
深度信念网络
极限学习机
语音情感识别
人机交互
基于特征参数融合的语音情感识别方法
语音情感识别
模糊熵
Mel频率倒谱
参数融合
基于情感特征分类的语音情感识别研究
语音情感识别
情感特征分类
改进D-S证据理论
证据信任度信息熵
动态先验权重
数据融合
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于多任务深度特征提取及 MKPCA 特征融合的语音情感识别
来源期刊 太原理工大学学报 学科
关键词 语音情感识别 多任务学习 声学深度特征 语谱图特征 多核主成分分析
年,卷(期) 2024,(5) 所属期刊栏目
研究方向 页码范围 22-28
页数 7页 分类号
字数 语种 中文
DOI 10.16355/j.tyut.1007-9432.2023.05.004
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2024(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
语音情感识别
多任务学习
声学深度特征
语谱图特征
多核主成分分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
太原理工大学学报
双月刊
1007-9432
14-1220/N
大16开
太原市迎泽西大街79号3337信箱
1957-01-01
汉语
出版文献量(篇)
4103
总下载数(次)
0
总被引数(次)
28999
论文1v1指导