基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了解决基于词语的维吾尔语语音识别系统集外词过多的问题,采用形态分析生成的语素或数据驱动切分生成的统计子词代替词语作为识别系统的词典单元.在此基础上,提出一种根据语素识别系统和统计子词识别系统在声学模型训练数据上的音素错误率差别选择词语最佳分解结果,从而构建语素-统计子词联合词典的方法.在维吾尔语电话交谈式语音识别任务上比较各个系统的性能.实验结果表明,语素或统计子词的运用能有效缓解词语系统集外词过多的问题.与词典大小为200K的词语系统相比,55K的语素-统计子词联合系统使测试集上的音素错误率从45.4%下降到43.8%.
推荐文章
面向大词汇量的维吾尔语连续语音识别研究
维吾尔语
语音语料库
大词汇
识别技术
南疆维吾尔语语音识别研究与实现
维吾尔语
语音识别
动态时间规整
基于子字单元的维吾尔语语音识别研究
维吾尔语
词切分
子字单元
隐马尔科夫模型
连续语音识别
维吾尔语褒贬情感词典构建研究
维吾尔语
情感极性判别
点互信息算法
语料库
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向维吾尔语电话交谈式语音识别的词典设计方法研究
来源期刊 重庆邮电大学学报(自然科学版) 学科 工学
关键词 黏着语 语音识别 集外词 词语分解 分解方法联合
年,卷(期) 2013,(3) 所属期刊栏目 计算机与自动化
研究方向 页码范围 391-396
页数 6页 分类号 TP37
字数 5849字 语种 中文
DOI 10.3979/j.issn.1673-825X.2013.03.020
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 颜永红 中国科学院声学研究所 94 586 14.0 20.0
5 李鑫 46 386 9.0 19.0
14 潘接林 中国科学院声学研究所 23 215 7.0 14.0
18 侯炜 4 4 1.0 1.0
19 计哲 3 7 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (17)
参考文献  (7)
节点文献
引证文献  (2)
同被引文献  (3)
二级引证文献  (0)
1980(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(3)
  • 参考文献(2)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(4)
  • 参考文献(2)
  • 二级参考文献(2)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
黏着语
语音识别
集外词
词语分解
分解方法联合
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
重庆邮电大学学报(自然科学版)
双月刊
1673-825X
50-1181/N
大16开
重庆南岸区
78-77
1988
chi
出版文献量(篇)
3229
总下载数(次)
12
总被引数(次)
19476
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导