基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
鉴于自动语音识别(ASR)中置信度估计困难的问题,该文提出一种基于多知识源融合的策略来提高置信度的鉴别能力.具体做法是,首先选择关于识别结果的声学层、语言层和语义层等不同层次的信息,然后通过实验确定这些信息不同的组合方式,并以此为特征在隐藏单元条件随机场(Hidden-units Conditional Random Fields,HuCRFs)框架下计算识别结果的条件概率.最后将HuCRFs条件概率作为语音识别结果置信度的新的估计.实验首先证明了HuCRFs条件概率是比归一化的网格后验概率鉴别能力更强的一种置信度估计方法.同时基于HuCRFs条件概率置信度,对解码器一遍识别得到的网格重新搜索最佳候选序列,取得了相对一遍识别最佳候选序列绝对近2%的字错误率(CER)下降.同时,该文也对比了基于HuCRFs条件概率搜索的最佳候选序列和基于长语言模型网格重估的最佳候选序列的性能,进一步证明了使用HuCRFs条件概率作为置信度估计是一种更好的选择.
推荐文章
命令词语音识别系统的置信度改进方法
自动语音识别
置信度判决
高斯混合模型
时长信息
得分融合
融合多模型与高置信度词典的事件线索检测
事件线索检测
最大熵模型
条件随机模型
高置信度词典
基于条件随机场的中国人名识别方法
命名实体识别
条件随机场
信息抽取
基于融合分层条件随机场的道路分割模型
分层条件随机场
融合
道路分割
多尺度特征
空间结构特征
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于隐藏单元条件随机场的多知识源融合改进自动语音识别置信度
来源期刊 电子与信息学报 学科 工学
关键词 语音识别 置信度估计 多知识源融合 隐藏单元条件随机场 网格重估
年,卷(期) 2014,(8) 所属期刊栏目 论文
研究方向 页码范围 1852-1858
页数 7页 分类号 TP391.42
字数 6586字 语种 中文
DOI 10.3724/SP.J.1146.2013.01614
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 颜永红 中国科学院声学研究所 94 586 14.0 20.0
2 高兴龙 中国科学院声学研究所 1 3 1.0 1.0
3 潘接林 中国科学院声学研究所 23 215 7.0 14.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (7)
节点文献
引证文献  (3)
同被引文献  (3)
二级引证文献  (0)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(4)
  • 参考文献(4)
  • 二级参考文献(0)
2014(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
语音识别
置信度估计
多知识源融合
隐藏单元条件随机场
网格重估
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子与信息学报
月刊
1009-5896
11-4494/TN
大16开
北京市北四环西路19号
2-179
1979
chi
出版文献量(篇)
9870
总下载数(次)
11
总被引数(次)
95911
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导