基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目前的说话人识别系统在噪声环境下性能将急剧下降,为了解决这一问题,提出了一种新的基于稀疏编码的说话人识别方法.该方法用一个通用背景字典(Universal background dictionary,UBD)刻画说话人语音的共性,并为每个说话人和环境噪声训练相应的字典来刻画说话人和环境的特殊变化.这些字典被拼接成一个大字典,然后将待测试语音稀疏分解在这个大字典上以实现说话人识别.为了提高说话人字典的区分能力,通过从说话人字典中移除与通用背景字典原子相似的原子来优化说话人字典.为了跟踪变化的噪声,采用混噪语音在线更新噪声字典.在各种噪声条件下的实验表明,所提出的方法在噪声环境下具有较强的鲁棒性.
推荐文章
基于GMM聚类的鲁棒性i向量说话人确认
说话人识别
高斯混合模型
巴氏距离
支持向量机
线性判别分析
基于稀疏表示的鲁棒性说话人识别系统
说话人识别
稀疏表示
多状态训练
谱减法
基于加权分块稀疏表示的光照鲁棒性人脸识别
人脸识别
光照归一化
稀疏表示
加权分块
基于稀疏鲁棒M-投资选择模型的鲁棒Half算法
稀疏投资选择模型
Half阈值算法
稀疏鲁棒M-投资选择
L1/2正则化
鲁棒Half阈值算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于稀疏编码的鲁棒说话人识别
来源期刊 数据采集与处理 学科 医学
关键词 说话人识别 稀疏表示 判别字典 形态成分分析
年,卷(期) 2014,(2) 所属期刊栏目
研究方向 页码范围 198-203
页数 6页 分类号 R318.04
字数 5210字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 韩纪庆 哈尔滨工业大学计算机科学与技术学院 97 760 13.0 22.0
2 何勇军 哈尔滨理工大学计算机科学与技术学院 17 65 6.0 7.0
3 孙广路 哈尔滨理工大学计算机科学与技术学院 27 99 6.0 8.0
4 付茂国 哈尔滨理工大学计算机科学与技术学院 2 15 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (6)
参考文献  (10)
节点文献
引证文献  (6)
同被引文献  (8)
二级引证文献  (3)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(4)
  • 参考文献(3)
  • 二级参考文献(1)
2007(3)
  • 参考文献(3)
  • 二级参考文献(0)
2011(3)
  • 参考文献(1)
  • 二级参考文献(2)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(3)
  • 引证文献(2)
  • 二级引证文献(1)
2017(3)
  • 引证文献(2)
  • 二级引证文献(1)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
说话人识别
稀疏表示
判别字典
形态成分分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数据采集与处理
双月刊
1004-9037
32-1367/TN
大16开
南京市御道街29号1016信箱
28-235
1986
chi
出版文献量(篇)
3235
总下载数(次)
7
总被引数(次)
25271
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
高等学校博士学科点专项科研基金
英文译名:
官方网址:http://std.nankai.edu.cn/kyjh-bsd/1.htm
项目类型:面上课题
学科类型:
论文1v1指导