基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
神经机器翻译在资源丰富的语种上取得了良好的翻译效果,但是由于数据稀缺问题在汉语-越南语这类低资源语言对上的性能不佳.目前缓解该问题最有效的方法之一是利用现有资源生成伪平行数据.考虑到单语数据的可利用性,在回译方法的基础上,首先将利用大量单语数据训练的语言模型与神经机器翻译模型进行融合,然后在回译过程中通过语言模型融入语言特性,以此生成更规范质量更优的伪平行数据,最后将生成的语料添加到原始小规模语料中训练最终翻译模型.在汉越翻译任务上的实验结果表明,与普通的回译方法相比,通过融合语言模型生成的伪平行数据使汉越神经机器翻译的BLEU值提升了1.41个百分点.
推荐文章
基于句子特征向量的汉-越伪平行句对抽取
句子特征向量
自我注意力机制
伪平行句对抽取
汉越机器翻译
面向维汉机器翻译的语料筛选技术研究
维汉机器翻译
语料筛选
语言模型
基于句法差异的汉-越平行句对抽取
句法特征
平行句对抽取
孪生循环神经网络
汉-越机器翻译
从文化的角度审视英、汉两种语言中的委婉语
委婉语
文化差异
语言禁忌
意转性技巧
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 融合单语语言模型的汉越伪平行语料生成
来源期刊 计算机应用 学科
关键词 汉越神经机器翻译 数据增强 伪平行数据 单语数据 语言模型
年,卷(期) 2021,(6) 所属期刊栏目 人工智能|Artificial intelligence
研究方向 页码范围 1652-1658
页数 7页 分类号 TP391
字数 语种 中文
DOI 10.11772/j.issn.1001-9081.2020071017
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (11)
共引文献  (5)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(1)
  • 参考文献(0)
  • 二级参考文献(1)
2017(2)
  • 参考文献(1)
  • 二级参考文献(1)
2018(2)
  • 参考文献(1)
  • 二级参考文献(1)
2021(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
汉越神经机器翻译
数据增强
伪平行数据
单语数据
语言模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导