基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在远程监督人物关系抽取算法中,训练集的构造是利用知识库对齐自由文本的方式完成的.这一过程会产生部分共现句无法表达当前实体对关系的情况.分析此问题产生的原因,结合词法、句法两个方面,提出一种利用句子模式聚类及模式评分对远程监督人物关系抽取过程训练集进行去噪的方法.该方法首先利用词向量生成特定关系描述候选词,其次针对关系描述候选词提取句子模式并进行模式聚类,最后对模式聚类结果进行评分.通过筛选评分较低模式对应句子去掉对关系描述能力不强甚至无法描述关系的句子,得到过滤后的训练集.实验证明,利用该方法对不同语料库进行远程监督原始训练集句子过滤能够在保证召回率的情况下取得3%~5%准确率提升.
推荐文章
基于远程监督的多因子人物关系抽取模型
关系抽取
人物关系
远程监督
机器学习
自然语言处理
面向招投标领域的远程监督实体关系抽取研究
实体关系抽取
远程监督
因子图模型
知识融合
基于双重注意力机制的远程监督中文关系抽取
中文关系抽取
远程监督
双重注意力机制
双向门限循环单元(BI-GRU)
互动百科
融合最近距离和人名窗口信息的人物关系抽取
最近距离
人名窗口
关系抽取
神经网络
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 远程监督人物关系抽取中的去噪研究
来源期刊 计算机应用与软件 学科 工学
关键词 人物关系抽取 远程监督 模式提取 模式聚类 模式评分
年,卷(期) 2017,(7) 所属期刊栏目 数据工程
研究方向 页码范围 11-18,31
页数 9页 分类号 TP3
字数 8755字 语种 中文
DOI 10.3969/j.issn.1000-386x.2017.07.003
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨静 华东师范大学计算机科学技术系 46 388 9.0 17.0
2 贺樑 华东师范大学计算机科学技术系 26 195 6.0 13.0
3 黄蓓静 华东师范大学计算机科学技术系 1 7 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (16)
共引文献  (108)
参考文献  (7)
节点文献
引证文献  (7)
同被引文献  (9)
二级引证文献  (2)
1974(1)
  • 参考文献(1)
  • 二级参考文献(0)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(4)
  • 参考文献(1)
  • 二级参考文献(3)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(5)
  • 引证文献(3)
  • 二级引证文献(2)
2020(3)
  • 引证文献(3)
  • 二级引证文献(0)
研究主题发展历程
节点文献
人物关系抽取
远程监督
模式提取
模式聚类
模式评分
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用与软件
月刊
1000-386X
31-1260/TP
大16开
上海市愚园路546号
4-379
1984
chi
出版文献量(篇)
16532
总下载数(次)
47
总被引数(次)
101489
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导