原文服务方: 现代电子技术       
摘要:
少数民族语言进行语音识别时存在训练数据稀疏导致识别率低的问题.该文在对低资源的柯尔克孜语识别时,提出一种CMN网络构建跨语种声学模型.CMN网络模型利用CNN的局部采样和权值共享技术减少网络参数,并采用maxout神经元替换CNN的卷积核提高网络抽象特征提取能力.跨语种的CMN首先用资源相对丰富的维吾尔语进行预训练,为防止过拟合使用dropout正则化训练方法,并根据两种语言的相似性创建基于同义词强制对齐的音素映射集,然后标注待识别的柯尔克孜语数据,最后用有限的目标语语料对CMN网络参数进行微调.实验结果表明,所提CMN声学模型较基线CNN声学模型字错误率(WER)有8.3%的降低.
推荐文章
基于CapsNet的中国手指语识别
手语
手指语识别
神经网络
胶囊网络
基于BiLSTM-Attention唇语识别的研究
唇语识别
双向长短时记忆网络
注意力机制
深度学习
时序编码
采用长短时记忆网络的低资源语音识别方法
语音识别
低资源
长短时记忆
神经网络
基于迁移学习的低资源度维吾尔语语音识别
语音识别
声学模型
维吾尔语
低资源度
深度神经网络
迁移学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于CMN网络的低资源柯尔克孜语识别研究
来源期刊 现代电子技术 学科
关键词 语音识别 低资源 柯尔克孜语 跨语种声学模型 CMN 音素映射
年,卷(期) 2018,(24) 所属期刊栏目 前沿交叉科学
研究方向 页码范围 132-136,140
页数 6页 分类号 TN711-34|TP391
字数 语种 中文
DOI 10.16652/j.issn.1004-373x.2018.24.033
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 热依曼·吐尔逊 新疆大学信息科学与工程学院 21 82 6.0 8.0
2 吾守尔·斯拉木 新疆大学信息科学与工程学院 148 619 13.0 18.0
3 孙杰 新疆大学信息科学与工程学院 13 56 4.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (18)
共引文献  (18)
参考文献  (6)
节点文献
引证文献  (1)
同被引文献  (2)
二级引证文献  (0)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2011(4)
  • 参考文献(1)
  • 二级参考文献(3)
2012(3)
  • 参考文献(1)
  • 二级参考文献(2)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(2)
  • 参考文献(0)
  • 二级参考文献(2)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
语音识别
低资源
柯尔克孜语
跨语种声学模型
CMN
音素映射
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
现代电子技术
半月刊
1004-373X
61-1224/TN
大16开
1977-01-01
chi
出版文献量(篇)
23937
总下载数(次)
0
总被引数(次)
135074
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导