基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在说话人确认中,特征端因子分析(Acoustic Factor Analysis,AFA)利用MPPCA(Mixtures of Probabilistic Principal Component Analyzers,MPPCA)算法在通用背景模型(Universal Background Model,UBM)的每个高斯上分别对特征降维以去除语音特征中文本、信道和噪声等信息的干扰,获得增强的说话人信息并用于提升说话人确认的性能.但是通用背景模型属于无监督的聚类方法,其每个高斯成分物理意义不够明确,不能区分不同说话人发不同音素时的情况.为解决这一问题,本文利用语音识别中的声学模型深度神经网络(Deep Neural Network,DNN)取代传统的通用背景模型并结合特征端因子分析分别对不同音素上的语音特征进行降维提取出说话人信息,进而提取DNN i-vector用于说话人确认.在RSR2015数据库PartⅢ上的实验结果表明该方法相对于基于UBM的特征端因子分析方法在男女测试集上等错误率(Equal Error Rate,EER)分别下降13.49%和22.43%.
推荐文章
基于因子分析和特征映射的耳语说话人识别
耳语说话人识别
联合因子分析
特征映射
正常音
耳语音
一种基于MFCC与韵律特征的说话人确认方法
说话人确认
梅尔倒谱系数
韵律特征
基于GMM聚类的鲁棒性i向量说话人确认
说话人识别
高斯混合模型
巴氏距离
支持向量机
线性判别分析
采用非监督得分规整和因子分析的说话人确认
说话人确认
联合因子分析
非监督得分规整
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 说话人确认中以音素为中心的特征端因子分析
来源期刊 信号处理 学科 工学
关键词 特征端因子分析 差异因子 深度神经网络 说话人确认
年,卷(期) 2016,(10) 所属期刊栏目 应用
研究方向 页码范围 1213-1219
页数 7页 分类号 TN912.34
字数 4649字 语种 中文
DOI 10.16798/j.issn.1003-0530.2016.10.10
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 戴礼荣 中国科学技术大学语音及语言信息处理国家工程实验室 86 643 14.0 21.0
2 陈丽萍 中国科学技术大学语音及语言信息处理国家工程实验室 5 29 3.0 5.0
3 张涛涛 中国科学技术大学语音及语言信息处理国家工程实验室 2 14 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (5)
参考文献  (10)
节点文献
引证文献  (3)
同被引文献  (3)
二级引证文献  (0)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(3)
  • 参考文献(1)
  • 二级参考文献(2)
2012(2)
  • 参考文献(1)
  • 二级参考文献(1)
2013(2)
  • 参考文献(1)
  • 二级参考文献(1)
2014(3)
  • 参考文献(2)
  • 二级参考文献(1)
2015(2)
  • 参考文献(1)
  • 二级参考文献(1)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
特征端因子分析
差异因子
深度神经网络
说话人确认
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信号处理
月刊
1003-0530
11-2406/TN
大16开
北京鼓楼西大街41号
18-143
1985
chi
出版文献量(篇)
5053
总下载数(次)
13
总被引数(次)
32728
相关基金
国家科技支撑计划
英文译名:
官方网址:http://kjzc.jhgl.org/
项目类型:重大项目
学科类型:能源
论文1v1指导