原文服务方: 现代电子技术       
摘要:
少数民族语言进行语音识别时存在训练数据稀疏导致识别率低的问题.该文在对低资源的柯尔克孜语识别时,提出一种CMN网络构建跨语种声学模型.CMN网络模型利用CNN的局部采样和权值共享技术减少网络参数,并采用maxout神经元替换CNN的卷积核提高网络抽象特征提取能力.跨语种的CMN首先用资源相对丰富的维吾尔语进行预训练,为防止过拟合使用dropout正则化训练方法,并根据两种语言的相似性创建基于同义词强制对齐的音素映射集,然后标注待识别的柯尔克孜语数据,最后用有限的目标语语料对CMN网络参数进行微调.实验结果表明,所提CMN声学模型较基线CNN声学模型字错误率(WER)有8.3%的降低.
推荐文章
基于HMM的柯尔克孜语词性标注的研究
柯尔克孜语
自动分词词典
隐马尔可夫模型(HMM)
词性标注
基于迁移学习的低资源度维吾尔语语音识别
语音识别
声学模型
维吾尔语
低资源度
深度神经网络
迁移学习
基于卷积神经网络的维吾尔语语音识别
卷积神经网络
语音识别
特征空间最大似然线性回归特征
最大输出
维吾尔语
基于剪枝AlexNet的普米语孤立词识别
孤立词识别
卷积神经网络
AlexNet剪枝网络
迭代剪枝算法
普米语语谱图
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于CMN网络的低资源柯尔克孜语识别研究
来源期刊 现代电子技术 学科
关键词 语音识别 低资源 柯尔克孜语 跨语种声学模型 CMN 音素映射
年,卷(期) 2018,(24) 所属期刊栏目 前沿交叉科学
研究方向 页码范围 132-136,140
页数 6页 分类号 TN711-34|TP391
字数 语种 中文
DOI 10.16652/j.issn.1004-373x.2018.24.033
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 热依曼·吐尔逊 新疆大学信息科学与工程学院 21 82 6.0 8.0
2 吾守尔·斯拉木 新疆大学信息科学与工程学院 148 619 13.0 18.0
3 孙杰 新疆大学信息科学与工程学院 13 56 4.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (18)
共引文献  (18)
参考文献  (6)
节点文献
引证文献  (1)
同被引文献  (2)
二级引证文献  (0)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2011(4)
  • 参考文献(1)
  • 二级参考文献(3)
2012(3)
  • 参考文献(1)
  • 二级参考文献(2)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(2)
  • 参考文献(0)
  • 二级参考文献(2)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
语音识别
低资源
柯尔克孜语
跨语种声学模型
CMN
音素映射
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
现代电子技术
半月刊
1004-373X
61-1224/TN
大16开
1977-01-01
chi
出版文献量(篇)
23937
总下载数(次)
0
总被引数(次)
135074
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导