原文服务方: 计算机应用研究       
摘要:
针对常用基于音频特征的多说话人聚类初始化方法精度不高这一问题,提出了一种基于视频信号的新方法.该方法通过运用每一时间帧视频信号的运动强度特征对聚类初始化阶段的初始话者类进行选择,有效提升了说话人初始类纯度.最后将该方法应用到高斯混合模型(GMM)多说话人识别系统.实验结果表明,在整个会议集上该方法相比其他方法有了很大改善,较之线性初始化系统的错误识别率平均降低了19.436%,较之改进的线性初始化系统的错误识别率平均降低了16.618%.
推荐文章
改进的说话人聚类初始化和GMM的多说话人识别
多说话人识别
改进的聚类初始化
高斯混合模型
平均类纯度
改进的说话人聚类初始化和GMM的多说话人识别
多说话人识别
改进的聚类初始化
高斯混合模型
平均类纯度
数据挖掘中聚类初始化方法的优化研究
数据挖掘
聚类
聚类有效性
聚类初始化
分类属性
基于数据分布特性的聚类中心初始化方法
初始聚类中心
K-均值算法
网格化
局部最大值
距离优化
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于MFCC和运动强度聚类初始化的多说话人识别
来源期刊 计算机应用研究 学科
关键词 多说话人识别 聚类初始化 运动强度特征 运动强度初始化
年,卷(期) 2012,(9) 所属期刊栏目 算法研究探讨
研究方向 页码范围 3295-3298
页数 分类号 TP391.4
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2012.09.025
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 曹洁 兰州理工大学计算机与通信学院 180 1035 14.0 20.0
2 余丽珍 兰州理工大学电气工程与信息工程学院 2 19 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (2)
参考文献  (4)
节点文献
引证文献  (9)
同被引文献  (35)
二级引证文献  (52)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(3)
  • 引证文献(2)
  • 二级引证文献(1)
2014(6)
  • 引证文献(0)
  • 二级引证文献(6)
2015(8)
  • 引证文献(2)
  • 二级引证文献(6)
2016(7)
  • 引证文献(0)
  • 二级引证文献(7)
2017(9)
  • 引证文献(2)
  • 二级引证文献(7)
2018(6)
  • 引证文献(0)
  • 二级引证文献(6)
2019(14)
  • 引证文献(3)
  • 二级引证文献(11)
2020(8)
  • 引证文献(0)
  • 二级引证文献(8)
研究主题发展历程
节点文献
多说话人识别
聚类初始化
运动强度特征
运动强度初始化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导