基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对目前基于监督学习的关系抽取方法需要标注大量训练数据和预先定义关系类型,提出了一种基于词语共现信息构建关联网络并在关联网络上进行图聚类分析的人物关系提取方法.首先,从新闻标题数据获得关联度较高的500个人物对用于关系抽取研究;然后,抓取关联人物对所在新闻数据,对其进行预处理,并利用词频—逆向文档频率(TF-IDF)得到人物对共现句子中的关键词;其次,基于词语共现信息得到词语之间的关联,进而建立关键词关联网络;最后,利用对关联网络进行图聚类分析以获得人物关系.在关系抽取的实验中,与传统基于词语共现和模式匹配的中文实体关系提取方法相比,所提方法在准确率、召回率和平衡F分数(F-score)上分别提升了5.5,3.7和4.4个百分点.实验结果表明,所提算法能够在没有标注训练数据的条件下,有效地从新闻数据中抽取丰富且高质量的人物关系数据.
推荐文章
基于关注关系的互联网云数据挖掘方法实现
互联网
云数据
关注关系
数据挖掘
面向互联网开放平台保护用户隐私的关联规则挖掘算法
开放平台
隐私保护
分布式
关联规则挖掘
基于机会网络中社交关系的转发机制
机会网络
社会关系
转发机制
权重值
可靠性
可利用性
Web文本挖掘在互联网信息统计中的研究与设计
互联网
信息统计
Web挖掘
文本挖掘
文本分类
模式匹配
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于信息关联拓扑的互联网社交关系挖掘
来源期刊 计算机应用 学科 工学
关键词 社会关系抽取 共现统计 词语关联度 关联网络 图聚类
年,卷(期) 2016,(7) 所属期刊栏目 人工智能
研究方向 页码范围 1875-1880
页数 6页 分类号 TP391.1
字数 7387字 语种 中文
DOI 10.11772/j.issn.1001-9081.2016.07.1875
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 周慧 20 121 4.0 10.0
2 邢凯 中国科学技术大学计算机科学与技术学院 12 24 3.0 4.0
6 张利萍 中国科学技术大学苏州研究院 4 12 3.0 3.0
7 芮伟康 中国科学技术大学计算机科学与技术学院 3 11 3.0 3.0
11 刘锦文 中国科学技术大学计算机科学与技术学院 2 8 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (55)
共引文献  (233)
参考文献  (14)
节点文献
引证文献  (4)
同被引文献  (2)
二级引证文献  (7)
1958(1)
  • 参考文献(0)
  • 二级参考文献(1)
1959(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(4)
  • 参考文献(1)
  • 二级参考文献(3)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(6)
  • 参考文献(2)
  • 二级参考文献(4)
2006(9)
  • 参考文献(1)
  • 二级参考文献(8)
2007(4)
  • 参考文献(1)
  • 二级参考文献(3)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(4)
  • 参考文献(1)
  • 二级参考文献(3)
2010(5)
  • 参考文献(2)
  • 二级参考文献(3)
2011(6)
  • 参考文献(1)
  • 二级参考文献(5)
2012(4)
  • 参考文献(2)
  • 二级参考文献(2)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(3)
  • 参考文献(1)
  • 二级参考文献(2)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(3)
  • 引证文献(2)
  • 二级引证文献(1)
2019(5)
  • 引证文献(2)
  • 二级引证文献(3)
2020(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
社会关系抽取
共现统计
词语关联度
关联网络
图聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导