基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基于贝叶斯或者全贝叶斯准则的说话人自动聚类或者识别方法,主要采取重复换算全发话语音段的相似量度,再组合相似性较大的语音片段实现说话人的聚类.这种方法中如果发话语音片段数越多,组合计算时间就越长,系统实时性变差,而且各说话人模型用GMM方法建立,发话语音时间短暂时GMM的信赖性降低,最终影响说话人聚类精度.针对上述问题,提出引用i-vector说话人相似度的非负值矩阵分解的高精度快速说话人聚类方法.
推荐文章
基于改进i-vector的说话人感知训练方法研究
说话人感知训练
辨识向量
深度神经网络
奇异值矩阵分解
瓶颈特征
基于i-vector和深度学习的说话人识别
说话人识别
深度神经网络
i-vector
声纹特征
基于说话人模型聚类的说话人识别
说话人识别
高斯混合模型
说话人模型聚类(SMC)
基于i-vector说话人识别算法中训练时长研究
说话人识别
i-vector
Kaldi
训练时长
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 用说话人相似度i-vector的非负值矩阵分解说话人聚类
来源期刊 计算机应用与软件 学科 工学
关键词 说话人分割及聚类 非负值矩阵分解 i-vector GMM 电话语音
年,卷(期) 2017,(4) 所属期刊栏目 人工智能与识别
研究方向 页码范围 165-168,242
页数 5页 分类号 TP391
字数 3347字 语种 中文
DOI 10.3969/j.issn.1000-386x.2017.04.028
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 钟珞 武汉理工大学计算机科学与技术学院 195 1963 24.0 32.0
2 达瓦·伊德木草 新疆大学多语言技术重点实验室 8 16 3.0 4.0
3 哈尔肯别克·木哈西 武汉理工大学计算机科学与技术学院 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (29)
共引文献  (11)
参考文献  (9)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1980(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(3)
  • 参考文献(0)
  • 二级参考文献(3)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(8)
  • 参考文献(0)
  • 二级参考文献(8)
2010(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(3)
  • 参考文献(3)
  • 二级参考文献(0)
2012(3)
  • 参考文献(2)
  • 二级参考文献(1)
2014(3)
  • 参考文献(3)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
说话人分割及聚类
非负值矩阵分解
i-vector
GMM
电话语音
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用与软件
月刊
1000-386X
31-1260/TP
大16开
上海市愚园路546号
4-379
1984
chi
出版文献量(篇)
16532
总下载数(次)
47
总被引数(次)
101489
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导