基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在神经机器翻译中,因词表受限导致的集外词问题很大程度上影响了翻译系统的准确性.对于训练语料较少的资源稀缺型语言的神经机器翻译,这种问题表现得更为严重.近几年,受到外部知识融入的启发,该文在RNNSearch模型基础上,提出了一种融入分类词典的汉越混合网络神经机器翻译集外词处理方法.对于给定的源语言句子,扫描分类词典以确定候选短语句对并标签标记,解码端利用词级组件和短语组件的混合解码网络,很好地生成单词集外词和短语集外词的翻译,从而改善汉越神经机器翻译的性能.在汉越、英越和蒙汉翻译实验上表明,该方法显著提高了准确率,对于资源稀缺型语言的神经机器翻译性能有一定的提升.
推荐文章
维汉机器翻译未登录词识别研究
维汉机器翻译
短语表
字符串相似度算法
未登录词
词切分
编辑距离
汉英机器翻译中的趋向词处理研究
机器翻译
趋向词
合一运算
面向汉维机器翻译的双语关联度优化模型
维吾尔语
神经网络机器翻译
注意力机制
词对齐
生成概率
人物简历汉维机器翻译系统的设计与实现
人物简历
汉维机器翻译
模板库
命名实体
正则表达式
句子结构
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 融入分类词典的汉越混合网络神经机器翻译集外词处理方法
来源期刊 中文信息学报 学科 工学
关键词 神经机器翻译 分类词典 资源稀缺 集外词
年,卷(期) 2019,(12) 所属期刊栏目 机器翻译
研究方向 页码范围 67-75
页数 9页 分类号 TP391
字数 6964字 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
神经机器翻译
分类词典
资源稀缺
集外词
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
相关基金
云南省自然科学基金
英文译名:
官方网址:
项目类型:面上项目
学科类型:
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导