基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
语音是一种重要的信息资源传递与交流方式,人们经常使用语音作为交流信息的媒介,在语音的声学信号中包含大量的说话者信息、语义信息和丰富的情感信息,因此形成了解决语音学任务的3个不同方向,即声纹识别(Speaker Recognition,SR)、语音识别(Auto Speech Recognition,ASR)和情感识别(Speech Emotion Recognition,SER),3个任务均在各自的领域使用不同的技术与特定的方法进行信息提取与模型设计.文中首先综述了3个任务在国内外早期的发展历史路线,将语音任务的发展归纳为4个不同阶段,同时总结了3个语音学任务在特征提取时所采用的公共语音学特征,并针对每类特征的侧重点进行了说明.然后,随着近年来深度学习技术在各个领域中的广泛应用,语音任务也得到了很好的发展,文中针对目前流行的深度学习模型在声学建模中的应用分别进行了分析,按照有监督、无监督的方式总结了针对3种不同语音任务的声学特征提取方式及技术路线,还总结了基于多通道并融合注意力机制的模型,用于语音的特征提取.为了同时完成语音识别、声纹识别和情感识别任务,针对声学信号的个性化特征提出了一个基于多任务的Tandem模型;此外,提出了一个多通道协作网络模型,利用这种设计思路可以提升多任务特征提取的准确度.
推荐文章
基于多任务深度特征提取及 MKPCA 特征融合的语音情感识别
语音情感识别
多任务学习
声学深度特征
语谱图特征
多核主成分分析
基于改进语音特征提取方法的语音识别
语音识别
特征提取
最大似然线性转换
Mel频率倒谱系数
隐马尔柯夫模型
面向管制员语音疲劳判别任务的语音特征提取研究
空中交通管制
陆空通话
精神疲劳
模式识别
声学特征
基于EMD法的语音信号特征提取
语音信号
EMD
频率特征
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 语音任务下声学特征提取综述
来源期刊 计算机科学 学科
关键词 声学特征提取 声纹识别 语音识别 情感识别 深度学习 多通道融合
年,卷(期) 2020,(5) 所属期刊栏目 计算机图形学&多媒体
研究方向 页码范围 110-119
页数 10页 分类号
字数 13083字 语种 中文
DOI 10.11896/jsjkx.190400122
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郑纯军 大连海事大学信息科学技术学院 15 45 4.0 6.0
3 贾宁 大连东软信息学院计算机与软件学院 15 61 6.0 7.0
4 王春立 大连海事大学信息科学技术学院 20 130 7.0 10.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (85)
共引文献  (25)
参考文献  (11)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(7)
  • 参考文献(0)
  • 二级参考文献(7)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(7)
  • 参考文献(0)
  • 二级参考文献(7)
2010(6)
  • 参考文献(0)
  • 二级参考文献(6)
2011(11)
  • 参考文献(0)
  • 二级参考文献(11)
2012(5)
  • 参考文献(0)
  • 二级参考文献(5)
2013(3)
  • 参考文献(1)
  • 二级参考文献(2)
2014(12)
  • 参考文献(3)
  • 二级参考文献(9)
2015(19)
  • 参考文献(1)
  • 二级参考文献(18)
2016(4)
  • 参考文献(1)
  • 二级参考文献(3)
2017(4)
  • 参考文献(4)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
声学特征提取
声纹识别
语音识别
情感识别
深度学习
多通道融合
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学
月刊
1002-137X
50-1075/TP
大16开
重庆市渝北区洪湖西路18号
78-68
1974
chi
出版文献量(篇)
18527
总下载数(次)
68
论文1v1指导