基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着多媒体信息和通信技术的快速发展,网络上的多语言语音数据日益增多.语音识别作为语音分析与处理的核心技术,如何快速地把中文和英文等少数多资源主要语言处理能力推广到更多的低资源语言,是当前识别技术迫切需要突破的瓶颈.文中试图总结声学模型建模领域的最新进展,探讨传统语音识别技术从单语言向多语言跨越过程中可能面临的困难.并在此基础之上,探索了最新的端到端语音识别技术在关键词检索系统构建上的作用,以进一步改善系统的整体效果.最后总结了如下最新研究进展:1)基于模型参数共享的多语言声学建模;2)基于语种分类信息的多语言声学建模;3)基于帧级别对齐的端到端关键词检索技术.
推荐文章
现代经编技术最新进展
经编
新技术
经编机
液晶显示技术的最新进展
液晶
液晶显示器
视角
响应速度
开口率
熟肉真空冷却技术的最新进展
真空冷却
熟肉
食品工业
模拟
纳米晶体材料变形机制研究的最新进展
纳米晶体
变形机制
位错
缺陷
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 多语言语音识别声学模型建模方法最新进展
来源期刊 计算机科学 学科 工学
关键词 多语言 语音识别 声学模型
年,卷(期) 2022,(1) 所属期刊栏目 多语言计算前沿技术|Multilingual Computing Advanced Technology
研究方向 页码范围 47-52
页数 6页 分类号 TP391
字数 语种 中文
DOI 10.11896/jsjkx.210900013
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
多语言
语音识别
声学模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学
月刊
1002-137X
50-1075/TP
大16开
重庆市渝北区洪湖西路18号
78-68
1974
chi
出版文献量(篇)
18527
总下载数(次)
68
论文1v1指导