基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
蒙汉翻译属于低资源语言的翻译,面临着平行语料资源稀缺的困难,为了缓解平行语料数据稀缺和词汇表受限引发的翻译正确率低的问题,利用动态的数据预训练方法ELMo(Embeddings from Language Models),并结合多任务域信息共享的Transformer翻译架构进行蒙汉翻译.利用ELMo(深层语境化词表示)进行单语语料的预训练.利用FastText词嵌入算法把蒙汉平行语料库中的上下文语境相关的大规模文本进行预训练.根据多任务共享参数以实现域信息共享的原理,构建了一对多的编码器-解码器模型进行蒙汉神经机器翻译.实验结果表明,该翻译方法比Transformer基线翻译方法在长句子输入序列中可以有效提高翻译质量.
推荐文章
面向维汉机器翻译的语料筛选技术研究
维汉机器翻译
语料筛选
语言模型
维汉机器翻译未登录词识别研究
维汉机器翻译
短语表
字符串相似度算法
未登录词
词切分
编辑距离
泛化语言模型在汉维机器翻译中的应用
汉维机器翻译
泛化语言模型
字符串相似度算法
归一化处理
规则
译文评分
面向汉维机器翻译的双语关联度优化模型
维吾尔语
神经网络机器翻译
注意力机制
词对齐
生成概率
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 域信息共享的方法在蒙汉机器翻译中的应用
来源期刊 计算机工程与应用 学科 工学
关键词 蒙汉翻译 多任务学习 Transformer ELMo FastText
年,卷(期) 2020,(10) 所属期刊栏目 模式识别与人工智能
研究方向 页码范围 106-114
页数 9页 分类号 TP391
字数 8964字 语种 中文
DOI 10.3778/j.issn.1002-8331.1905-0122
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 苏依拉 内蒙古工业大学信息工程学院 65 139 6.0 9.0
2 张振 内蒙古工业大学信息工程学院 4 0 0.0 0.0
3 牛向华 内蒙古工业大学信息工程学院 7 2 1.0 1.0
4 高芬 内蒙古工业大学信息工程学院 8 0 0.0 0.0
5 赵亚平 内蒙古工业大学信息工程学院 8 2 1.0 1.0
6 仁庆道尔吉 内蒙古工业大学信息工程学院 27 22 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(2)
  • 参考文献(2)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
蒙汉翻译
多任务学习
Transformer
ELMo
FastText
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导