基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
远监督关系抽取的最大优势是通过知识库和自然语言文本的自动对齐生成标记数据.这种简单的自动对齐机制在将人从繁重的样本标注工作中解放出来的同时,不可避免地会产生各种错误数据标记,进而影响构建高质量的关系抽取模型.针对远监督关系抽取任务中的标记噪声问题,提出“最终句子对齐的标签是基于某些未知因素所生成的带噪观测结果”这一假设.并在此假设的基础上,构建由编码层、基于噪声分布的注意力层、真实标签输出层和带噪观测层的新型关系抽取模型.模型利用自动标记的数据学习真实标签到噪声标签的转移概率,并在测试阶段,通过真实标签输出层得到最终的关系分类.随后,研究带噪观测模型与深度神经网络的结合,重点讨论基于深度神经网络编码的噪声分布注意力机制以及深度神经网络框架下不均衡样本的降噪处理.通过以上研究,进一步提升基于带噪观测远监督关系抽取模型的抽取精度和鲁棒性.最后,在公测数据集和同等参数设置下进行带噪观测远监督关系抽取模型的验证实验,通过分析样本噪声的分布情况,对在各种样本噪声分布下的带噪观测模型进行性能评价,并与现有的主流基线方法进行比较.结果显示,所提出的带噪观测模型具有更高的准确率和召回率.
推荐文章
基于循环卷积神经网络的实体关系抽取方法研究
GRU
循环卷积神经网络
注意力机制
关系抽取
神经网络规则抽取研究
神经网络
规则抽取
机器学习
基于蚁群算法的神经网络规则抽取
神经网络
规则抽取
蚁群算法
聚类
神经网络的滤噪纠错能力验证
神经网络
损伤检测
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于带噪观测的远监督神经网络关系抽取
来源期刊 软件学报 学科 工学
关键词 远监督 关系抽取 噪声标签
年,卷(期) 2020,(4) 所属期刊栏目 非经典条件下的机器学习方法专题
研究方向 页码范围 1025-1038
页数 14页 分类号 TP181
字数 9857字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王璐 北京大学北京国际数学研究中心 116 380 11.0 18.0
2 薛环 吉林大学计算机科学与技术学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (35)
共引文献  (26)
参考文献  (7)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(5)
  • 参考文献(1)
  • 二级参考文献(4)
2014(4)
  • 参考文献(1)
  • 二级参考文献(3)
2015(5)
  • 参考文献(0)
  • 二级参考文献(5)
2016(5)
  • 参考文献(0)
  • 二级参考文献(5)
2017(9)
  • 参考文献(0)
  • 二级参考文献(9)
2018(4)
  • 参考文献(2)
  • 二级参考文献(2)
2019(2)
  • 参考文献(2)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
远监督
关系抽取
噪声标签
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导