基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对传统基于远程监督的关系抽取方法中存在噪声和负例数据利用不足的问题,提出结合从句级远程监督和半监督集成学习的关系抽取方法.首先通过远程监督构建关系实例集,使用基于从句识别的去噪算法去除关系实例集中的噪声.然后抽取关系实例的词法特征并转化为分布式表征向量,构建特征数据集.最后选择特征数据集中所有正例数据和部分负例数据组成标注数据集,其余的负例数据组成未标注数据集,通过改进的半监督集成学习算法训练关系分类器.实验表明,相比基线方法,文中方法可以获得更高的分类准确率和召回率.
推荐文章
基于GRU和注意力机制的远程监督关系抽取
深度学习
远程监督
门控循环单元
注意力机制
基于sentence2vec与半监督算法的中文问答提问模式抽取
关系抽取
提问模式
条件随机场
自举
句向量
结合主动学习策略的半监督分类算法
半监督分类
主动学习
投票熵
样本密度
基于半监督学习的应用流分类方法
流量分类
半监督学习
特征选择
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 结合从句级远程监督与半监督集成学习的关系抽取方法
来源期刊 模式识别与人工智能 学科 工学
关键词 关系抽取 远程监督 从句识别 去噪 半监督集成学习
年,卷(期) 2017,(1) 所属期刊栏目
研究方向 页码范围 54-63
页数 10页 分类号 TP311
字数 7891字 语种 中文
DOI 10.16451/j.cnki.issn1003-6059.201701006
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈岭 浙江大学计算机科学与技术学院 48 269 9.0 14.0
2 吴勇 7 48 4.0 6.0
3 王敬昌 10 62 5.0 7.0
4 余小康 浙江大学计算机科学与技术学院 1 8 1.0 1.0
5 郭敬 浙江大学计算机科学与技术学院 1 8 1.0 1.0
6 蔡雅雅 浙江大学计算机科学与技术学院 1 8 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (130)
参考文献  (5)
节点文献
引证文献  (8)
同被引文献  (28)
二级引证文献  (17)
1988(1)
  • 参考文献(1)
  • 二级参考文献(0)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(2)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(3)
  • 引证文献(3)
  • 二级引证文献(0)
2019(9)
  • 引证文献(2)
  • 二级引证文献(7)
2020(12)
  • 引证文献(2)
  • 二级引证文献(10)
研究主题发展历程
节点文献
关系抽取
远程监督
从句识别
去噪
半监督集成学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
模式识别与人工智能
月刊
1003-6059
34-1089/TP
16开
中国科学院合肥智能机械研究所安徽合肥董铺岛合肥1130信箱
26-69
1989
chi
出版文献量(篇)
2928
总下载数(次)
8
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导