基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
该文针对美国国家标准与技术研究院(NIST)的NIST评测,构建了一套多距离麦克风说话人分类及定位语音处理系统,针对NIST富标注评测中提出的说话人分类问题,提出改进的结合时延估计和聚类的说话人分类方法,在保证稳定性的前提下降低说话人分类的复杂度并提高准确率;提出一种新的相邻阵元间时延构造矩阵方程算法,可得到多个说话人的方向角.实验在标准会议环境下采集真实语音数据进行算法验证,说话人分类算法的正确率接近目前主要说话人分类系统的正确率,定位方向角误差在3°以内.实验结果说明,适当条件下多距离麦克风系统可作为合适的语音信号输入设备应用于多人多方会议环境.
推荐文章
基于说话人分类技术的分级说话人识别研究
说话人辨识
说话人确认
说话人分类
Cohort集
可信度打分
基于支持向量机的说话人识别研究
支持向量机
说话人识别
结构风险最小化
核函数
基于因特网的说话人识别技术研究
因特网
说话人识别
Mel倒谱参数
交织
分组丢失
说话人识别技术研究
说话人识别
说话人辨认
说话人确认
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于NIST评测的说话人分类及定位技术研究
来源期刊 电子与信息学报 学科 工学
关键词 说话人分类 说话人定位 多距离麦克风 时延聚类 时延矩阵
年,卷(期) 2011,(5) 所属期刊栏目 研究简报
研究方向 页码范围 1234-1237
页数 分类号 TN912.3
字数 2847字 语种 中文
DOI 10.3724/SP.J.1146.2010.00977
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 宋辉 清华大学电子工程系 8 14 3.0 3.0
2 刘加 清华大学电子工程系 79 938 18.0 28.0
3 杨毅 清华大学电子工程系 32 269 7.0 16.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (11)
共引文献  (10)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1972(1)
  • 参考文献(0)
  • 二级参考文献(1)
1976(1)
  • 参考文献(1)
  • 二级参考文献(0)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
说话人分类
说话人定位
多距离麦克风
时延聚类
时延矩阵
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子与信息学报
月刊
1009-5896
11-4494/TN
大16开
北京市北四环西路19号
2-179
1979
chi
出版文献量(篇)
9870
总下载数(次)
11
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导