基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
考虑连续语音中的协同发音现象,基于词-音素结构的DBN(WP-DBN)模型和词-音素-状态结构的DBN(WPS-DBN)模型,引入上下文相关的三音素单元,提出两个新颖的单流DBN模型:基于词-三音素结构的DBN(WT-DBN)模型和基于词-三音素-状态的DBN(WTS-DBN)模型.WTS-DBN模型是三音素模型,识别基元为三音素,以显式的方式模拟了基于三音素状态捆绑的隐马尔可夫模型(HMM).大词汇量语音识别实验结果表明:在纯净语音环境下,WTS-DBN模型的识别率比HMM,WT-DBN,WP-DBN和WPS-DBN模型的识别率分别提高了20.53%,40.77%,42.72%和7.52%.
推荐文章
基于动态贝叶斯网络的语音识别及音素切分研究
动态贝叶斯网络
图模型
图模型工具包
基于混合DBNN-BLSTM模型的大词汇量连续语音识别
大词汇量
语音识别
深度置信神经网络
双向长短时记忆模型
基于动态贝叶斯网络的语音识别及音素切分研究
动态贝叶斯网络
图模型
图模型工具包
基于混合DBNN-BLSTM模型的大词汇量连续语音识别
大词汇量
语音识别
深度置信神经网络
双向长短时记忆模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于三音素动态贝叶斯网络模型的大词汇量连续语音识别
来源期刊 数据采集与处理 学科 工学
关键词 语音识别 动态贝叶斯网络 三音素 音素
年,卷(期) 2009,(1) 所属期刊栏目 理论与试验研究
研究方向 页码范围 1-6
页数 6页 分类号 TP391.42
字数 5647字 语种 中文
DOI 10.3969/j.issn.1004-9037.2009.01.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 赵荣椿 西北工业大学计算机学院 223 3302 29.0 44.0
2 樊养余 西北工业大学电子信息学院 212 1698 20.0 32.0
3 张艳宁 西北工业大学计算机学院 187 2026 21.0 35.0
4 吕国云 西北工业大学电子信息学院 23 76 5.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (6)
同被引文献  (10)
二级引证文献  (74)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(4)
  • 引证文献(1)
  • 二级引证文献(3)
2015(7)
  • 引证文献(0)
  • 二级引证文献(7)
2016(17)
  • 引证文献(1)
  • 二级引证文献(16)
2017(16)
  • 引证文献(1)
  • 二级引证文献(15)
2018(22)
  • 引证文献(0)
  • 二级引证文献(22)
2019(8)
  • 引证文献(1)
  • 二级引证文献(7)
2020(4)
  • 引证文献(0)
  • 二级引证文献(4)
研究主题发展历程
节点文献
语音识别
动态贝叶斯网络
三音素
音素
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数据采集与处理
双月刊
1004-9037
32-1367/TN
大16开
南京市御道街29号1016信箱
28-235
1986
chi
出版文献量(篇)
3235
总下载数(次)
7
总被引数(次)
25271
相关基金
中国博士后科学基金
英文译名:China Postdoctoral Science Foundation
官方网址:http://www.chinapostdoctor.org.cn/index.asp
项目类型:
学科类型:
国家高技术研究发展计划(863计划)
英文译名:The National High Technology Research and Development Program of China
官方网址:http://www.863.org.cn
项目类型:重点项目
学科类型:信息技术
论文1v1指导