基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了克服文本标题的人物关系抽取中非人物实体的干扰、关系特征词的选取以及标题中多人物实体对目标实体的关系判定的影响,提出基于决策树的人物实体判别、基于最小集合覆盖的关系特征词生成以及基于三层句式规则统计方法.首先,针对中国机器学习会议(CCML)竞赛中人物关系属性文件中对人物的描述,提取18种特征,采用C4.5分类器,获得了98.2%的查全率和92.6%的查准率,其结果作为下一步人物关系判定的条件;其次,为了保证特征词集合的规模维持在合适的水平,采用了基于最小集合覆盖的特征词覆盖的算法,结果表明,随着特征词集合达到一定的规模,特征词集合完成对所有类别关系的集合覆盖,用以判定文本标题中人物关系类型;最后,采用三层句式规则统计方法,用以生成过滤掉比重较小的句子规则和根据关系正负比例判定的进一步细分句式规则,以判定文本标题关系与否.实验结果表明,在19种人物关系判定上取得82.9%的查全率、74.4%的查准率以及78.4%的F1测度.所提方法可以有效用于新闻标题人物关系提取,用以构建人物关系知识图谱.
推荐文章
基于双模型投票的人物关系抽取研究
关系抽取
最大熵模型
支持向量机
投票
基于双模型投票的人物关系抽取研究
关系抽取
最大熵模型
支持向量机
投票
基于规则的人物信息抽取算法的研究
文本信息抽取
人物信息抽取
人物属性规则
抽取算法
基于信息增益的 Web 人物关系抽取
关系抽取
信息增益
模板匹配
多分类
自然语言处理
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向文本标题的人物关系抽取
来源期刊 计算机应用 学科 工学
关键词 人物关系抽取 文本标题 最小集合覆盖 实体判别 句法规则
年,卷(期) 2016,(3) 所属期刊栏目 人工智能
研究方向 页码范围 726-730
页数 5页 分类号 TP391
字数 5347字 语种 中文
DOI 10.11772/j.issn.1001-9081.2016.03.726
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张洋 中国科学院信息工程研究所 37 223 9.0 14.0
2 李全刚 中国科学院信息工程研究所 3 23 3.0 3.0
4 时金桥 中国科学院信息工程研究所 16 113 5.0 10.0
5 柳厅文 中国科学院信息工程研究所 8 81 5.0 8.0
6 闫旸 中国科学院信息工程研究所 1 3 1.0 1.0
7 赵佳鹏 中国科学院信息工程研究所 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (124)
参考文献  (5)
节点文献
引证文献  (3)
同被引文献  (17)
二级引证文献  (2)
1948(1)
  • 参考文献(1)
  • 二级参考文献(0)
1958(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(2)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(3)
  • 引证文献(1)
  • 二级引证文献(2)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
人物关系抽取
文本标题
最小集合覆盖
实体判别
句法规则
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
总被引数(次)
209512
论文1v1指导