基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在语音识别与特征系统中,通过无监督的方法搜索未知语音流中出现的语言模式。利用语音识别系统的多候选结果,通过分段动态时间弯曲算法进行语言模式的搜索,采用有效的聚类算法以及置信度估计算法,提高系统性能,同时建立仅基于特征匹配的相似音频片段检测系统,不使用任何知识源,仅从语音中获取重复的语音模式,在广播电视新闻与自然口语对话2个测试集上对比2个系统的性能。实验结果表明,基于识别的系统具有较好的检测效果,而基于特征的系统具备多语种的推广性。
推荐文章
基于改进语音特征提取方法的语音识别
语音识别
特征提取
最大似然线性转换
Mel频率倒谱系数
隐马尔柯夫模型
人脸语音动画中语音特征参数提取算法研究
人脸语音动画
语音特征提取
小波变换
动态特征
组合特征参数
基于高斯小波滤波器的语音识别特征提取方法
特征提取
高斯小波
语音识别
基于多任务深度特征提取及 MKPCA 特征融合的语音情感识别
语音情感识别
多任务学习
声学深度特征
语谱图特征
多核主成分分析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于语音识别与特征的无监督语音模式提取
来源期刊 计算机工程 学科 工学
关键词 语音识别 语音模式发现 分段动态时间弯曲算法 图聚类算法 音素回环后验概率计算
年,卷(期) 2014,(5) 所属期刊栏目 多媒体技术及应用
研究方向 页码范围 262-265
页数 4页 分类号 TN912.34
字数 4373字 语种 中文
DOI 10.3969/j.issn.1000-3428.2014.05.054
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张震 中国科学院语言声学与内容理解重点实验室 14 59 4.0 7.0
2 赵庆卫 中国科学院语言声学与内容理解重点实验室 11 86 5.0 9.0
3 颜永红 中国科学院语言声学与内容理解重点实验室 94 586 14.0 20.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (12)
参考文献  (8)
节点文献
引证文献  (4)
同被引文献  (10)
二级引证文献  (13)
1977(1)
  • 参考文献(1)
  • 二级参考文献(0)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(2)
  • 二级参考文献(0)
1999(3)
  • 参考文献(1)
  • 二级参考文献(2)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(3)
  • 引证文献(2)
  • 二级引证文献(1)
2016(4)
  • 引证文献(0)
  • 二级引证文献(4)
2017(2)
  • 引证文献(1)
  • 二级引证文献(1)
2018(5)
  • 引证文献(1)
  • 二级引证文献(4)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
语音识别
语音模式发现
分段动态时间弯曲算法
图聚类算法
音素回环后验概率计算
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
论文1v1指导