面向自然语言推理的基于截断高斯距离的自注意力机制

张鹏飞; 李冠宇; 贾彩燕

文献导航

搜索文章

搜索思路

钛学术文献服务平台 \
学术期刊 \
工业技术期刊 \
自动化技术与计算机技术期刊 \
计算机科学期刊 \
面向自然语言推理的基于截断高斯距离的自注意力机制

面向自然语言推理的基于截断高斯距离的自注意力机制

作者：

张鹏飞李冠宇贾彩燕

基本信息来源于合作网站，原文需代理用户跳转至来源网站获取

自然语言推理

自注意力机制

距离掩码

截断高斯掩码

摘要：

在自然语言理解任务中,注意力机制由于可以有效捕获词在上下文语境中的重要程度并提高自然语言理解任务的有效性而受到了人们的普遍关注.基于注意力机制的非递归深度网络Transformer,不仅以非常少的参数和训练时间取得了机器翻译学习任务的最优性能,还在自然语言推理(Gaussian-Transformer)、词表示学习(Bert)等任务中取得了令人瞩目的成绩.目前Gaussian-Transformer已成为自然语言推理任务性能最好的方法之一.然而,在Transformer中引入Gaussian先验分布对词的位置信息进行编码,虽然可以大大提升邻近词的重要程度,但由于Gaussian分布中非邻近词的重要性会快速趋向于0,对当前词的表示有重要作用的非邻近词的影响会随着距离的加深消失殆尽.因此,文中面向自然语言推理任务,提出了一种基于截断高斯距离分布的自注意力机制,该方法不仅可以凸显邻近词的重要性,还可以保留对当前词表示具有重要作用的非邻近词的信息.在自然语言推理基准数据集SNLI和MultiNLI上的实验结果证实,截断高斯距离分布自注意力机制能够更有效地提取句子中词语的相对位置信息.

内容分析

关键词云

关键词热度

相关文献

推荐文献

根据相关规定，获取原文需跳转至原文服务方进行注册认证身份信息

完成下面三个步骤操作后即可获取文献，阅读后请点击下方页面【继续获取】按钮

钛学术文献服务平台

学术出版新技术应用与公共服务实验室出品

原文合作方

获取文献流程

1.访问原文合作方请等待几秒系统会自动跳转至登录页，首次访问请先注册账号，填写基本信息后，点击【注册】

2.注册后进行实名认证，实名认证成功后点击【返回】

3.检查邮箱地址是否正确，若错误或未填写请填写正确邮箱地址，点击【确认支付】完成获取，文献将在1小时内发送至您的邮箱

*若已注册过原文合作方账号的用户，可跳过上述操作，直接登录后获取原文即可

点击【获取原文】按钮，跳转至合作网站。

首次获取需要在合作网站进行注册。

注册并实名认证，认证后点击【返回】按钮。

确认邮箱信息，点击【确认支付】，订单将在一小时内发送至您的邮箱。

* 若已经注册过合作网站账号，请忽略第二、三步，直接登录即可。

期刊分类
期刊（年）
期刊（期）
期刊推荐

一般工业技术交通运输军事科技冶金工业动力工程化学工业原子能技术大学学报建筑科学无线电电子学与电信技术机械与仪表工业水利工程环境科学与安全科学电工技术石油与天然气工业矿业工程自动化技术与计算机技术航空航天轻工业与手工业金属学与金属工艺

计算机科学2022 计算机科学2021 计算机科学2020 计算机科学2019 计算机科学2018 计算机科学2017 计算机科学2016 计算机科学2015 计算机科学2014 计算机科学2013 计算机科学2012 计算机科学2011 计算机科学2010 计算机科学2009 计算机科学2008 计算机科学2007 计算机科学2006 计算机科学2005 计算机科学2004 计算机科学2003 计算机科学2002 计算机科学2001 计算机科学2000

计算机科学2020年第z2期计算机科学2020年第z1期计算机科学2020年第9期计算机科学2020年第8期计算机科学2020年第7期计算机科学2020年第6期计算机科学2020年第5期计算机科学2020年第4期计算机科学2020年第3期计算机科学2020年第2期计算机科学2020年第12期计算机科学2020年第11期计算机科学2020年第10期计算机科学2020年第1期

按字母查找期刊：

A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他

联系合作广告推广: shenyukuan@paperpass.com

篇名	面向自然语言推理的基于截断高斯距离的自注意力机制
来源期刊	计算机科学	学科	工学
关键词	自然语言推理自注意力机制距离掩码截断高斯掩码
年，卷（期）	2020,（4）	所属期刊栏目	人工智能
研究方向		页码范围	178-183
页数	6页	分类号	TP181
字数	5588字	语种	中文
DOI	10.11896/jsjkx.190600149

序号	姓名	单位	发文数	被引次数	H指数	G指数
1	贾彩燕	北京交通大学计算机与信息技术学院	23	180	9.0	12.0
2	张鹏飞	北京交通大学计算机与信息技术学院	8	22	3.0	4.0
3	李冠宇	北京交通大学交通数据分析与挖掘北京市重点实验室	2	0	0.0	0.0