基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
近年来随着人工智能和深度学习的发展,在神经机器翻译(NMT)的加持下,机器翻译的水平取得了长足的进步,但是在较大语料的情况下才能取得好的效果.此外,NMT的成功需要依赖于大量高质量的双语语料作为训练数据.在英法等丰富资源的语种(Rich resource language)翻译任务上,神经机器翻译机器的表现几乎可以媲美人类的水平.对于一些小语种(俗称低资源语种:Low resource language),无法提供足够多的双语数据,导致NMT出现过拟合问题,从而降低翻译效果.据此本文以低资源的汉傣语翻译为例,针对神经机器在低资源汉傣语机器翻译表现不佳的问题现状,开展了如下研究:(1)构造了以词向量为基础的初始化模型,利用傣汉词向量空间对齐的方法,来初始化神经翻译模型的词嵌入层以提高翻译的性能;(2)设计了傣汉词向量空间的对齐方法;(3)提出了一种基于词对齐的神经机器翻译框架.通过汉/傣、傣/汉双向翻译实验证明,该方法可以分别使汉/傣、傣/汉机器翻译的BLEU值提高2.38个和0.43个BLEU点.
推荐文章
维汉机器翻译未登录词识别研究
维汉机器翻译
短语表
字符串相似度算法
未登录词
词切分
编辑距离
面向维汉机器翻译的语料筛选技术研究
维汉机器翻译
语料筛选
语言模型
面向汉维机器翻译的双语关联度优化模型
维吾尔语
神经网络机器翻译
注意力机制
词对齐
生成概率
人物简历汉维机器翻译系统的设计与实现
人物简历
汉维机器翻译
模板库
命名实体
正则表达式
句子结构
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 低资源语种傣汉神经机器翻译方法
来源期刊 昆明理工大学学报(自然科学版) 学科 工学
关键词 低资源神经机器翻译 初始化模型 词向量对齐 注意力机制
年,卷(期) 2020,(4) 所属期刊栏目 机械、电子信息与自动控制
研究方向 页码范围 57-63
页数 7页 分类号 TP391
字数 语种 中文
DOI 10.16112/j.cnki.53-1223/n.2020.04.008
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李淼 中国科学院合肥物质科学研究院 155 1490 17.0 35.0
2 胡泽林 中国科学院合肥物质科学研究院 14 98 4.0 9.0
3 高翊 中国科学院合肥物质科学研究院 1 0 0.0 0.0
4 付莎 中国科学院合肥物质科学研究院 1 0 0.0 0.0
5 冯韬 中国科学院合肥物质科学研究院 2 0 0.0 0.0
6 麻之润 中国科学院合肥物质科学研究院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (1)
参考文献  (8)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1997(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(2)
  • 参考文献(1)
  • 二级参考文献(1)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(4)
  • 参考文献(2)
  • 二级参考文献(2)
2017(2)
  • 参考文献(1)
  • 二级参考文献(1)
2018(2)
  • 参考文献(1)
  • 二级参考文献(1)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
低资源神经机器翻译
初始化模型
词向量对齐
注意力机制
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
昆明理工大学学报(自然科学版)
双月刊
1007-855/X
53-1123/T
大16开
云南省昆明市呈贡区景明南路727号
64-79
1959
chi
出版文献量(篇)
3434
总下载数(次)
7
总被引数(次)
25009
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导