基于递进式半知识蒸馏的神经机器翻译

周孝青; 段湘煜; 俞鸿飞; 张民

文献导航

搜索文章

搜索思路

基于递进式半知识蒸馏的神经机器翻译

作者：

周孝青段湘煜俞鸿飞张民

基本信息来源于合作网站，原文需代理用户跳转至来源网站获取

机器翻译

模型压缩

知识蒸馏

摘要：

神经机器翻译(NMT)模型通常具有庞大的参数量,例如,Transformer在词表设为3万时有将近1亿的神经元,模型的参数量越大,模型越难优化,且存储模型的资源需求也越高.该文提出了一种压缩方法,用于将复杂且参数量大的N MT模型压缩为精简参数量小的N MT模型.该文同时提出半知识蒸馏方法和递进式半知识蒸馏方法,其中半知识蒸馏是从参数多、性能好的教师模型中获取半部分的权重作为精简、参数少的学生模型训练的起点;递进式半知识蒸馏方法指运用过一次半知识蒸馏方法压缩以后,再把当前的半知识蒸馏压缩的模型作为新的教师模型,再次运用半知识蒸馏方法得到全压缩模型.在广泛使用的中英和日英数据集上进行实验,结果表明,该方法对N MT系统有积极影响.在日英数据集上,该文方法的最佳性能比基准模型高2.16个BLEU值,比词级别知识蒸馏方法高1.15个BLEU值,并且高于句子级别的知识蒸馏方法0.28个BLEU值.

内容分析

关键词云

关键词热度

相关文献

推荐文献

根据相关规定，获取原文需跳转至原文服务方进行注册认证身份信息

完成下面三个步骤操作后即可获取文献，阅读后请点击下方页面【继续获取】按钮

钛学术文献服务平台

学术出版新技术应用与公共服务实验室出品

原文合作方

获取文献流程

1.访问原文合作方请等待几秒系统会自动跳转至登录页，首次访问请先注册账号，填写基本信息后，点击【注册】

2.注册后进行实名认证，实名认证成功后点击【返回】

3.检查邮箱地址是否正确，若错误或未填写请填写正确邮箱地址，点击【确认支付】完成获取，文献将在1小时内发送至您的邮箱

*若已注册过原文合作方账号的用户，可跳过上述操作，直接登录后获取原文即可

点击【获取原文】按钮，跳转至合作网站。

首次获取需要在合作网站进行注册。

注册并实名认证，认证后点击【返回】按钮。

确认邮箱信息，点击【确认支付】，订单将在一小时内发送至您的邮箱。

* 若已经注册过合作网站账号，请忽略第二、三步，直接登录即可。

期刊分类
期刊（年）
期刊（期）
期刊推荐

一般工业技术交通运输军事科技冶金工业动力工程化学工业原子能技术大学学报建筑科学无线电电子学与电信技术机械与仪表工业水利工程环境科学与安全科学电工技术石油与天然气工业矿业工程自动化技术与计算机技术航空航天轻工业与手工业金属学与金属工艺

中文信息学报2021年第8期中文信息学报2021年第7期中文信息学报2021年第6期中文信息学报2021年第5期中文信息学报2021年第4期中文信息学报2021年第3期中文信息学报2021年第2期中文信息学报2021年第12期中文信息学报2021年第10期中文信息学报2021年第1期

按字母查找期刊：

A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他

联系合作广告推广: shenyukuan@paperpass.com

篇名	基于递进式半知识蒸馏的神经机器翻译
来源期刊	中文信息学报	学科
关键词	机器翻译模型压缩知识蒸馏
年，卷（期）	2021,（2）	所属期刊栏目	机器翻译\|Machine Translation
研究方向		页码范围	52-60
页数	9页	分类号	TP391
字数		语种	中文
DOI	10.3969/j.issn.1003-0077.2021.02.005