基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统信息抽取针对特定的领域.当转换到新领域时,需要人工编写新的抽取规则和人工标记新的训练样本.开放信息抽取突破了传统信息抽取的局限性.现有的开放式信息抽取系统大多针对英文,然而,目前对于中文的研究相对较少,并主要以抽取三元组为主,没有针对中文抽取多元组的方法.因此提出了一种基于依存分析的中文开放式多元实体关系抽取方法.首先,对文本集进行预处理和依存关系分析;然后将动词视为候选关系词,将与此动词有满足条件的有效依存路径的基本名词短语视为实体词,关联两个及两个以上的实体词的关系词可与实体词组成候选多元实体关系组;最后,使用经过训练的逻辑回归分类器对多元实体关系组进行过滤.对百度百科数据集的抽取结果显示,所提方法在抽取大量实体关系多元组时准确性可达到81%.
推荐文章
面向中文专利的开放式实体关系抽取研究
中文专利依存树库
开放式实体关系抽取
Markov逻辑网
基于依存分析的开放式中文实体关系抽取方法
开放式信息抽取
中文实体关系抽取
依存分析
无监督
启发式规则
面向中文开放领域的多元实体关系抽取研究
中文、开放域
多元实体关系
依存句法分析
句法结构
关系抽取
语义关系
主谓宾
实体词语义信息对中文实体关系抽取的作用研究
《同义词词林》
知网
树核函数
关系抽取
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 中文开放式多元实体关系抽取
来源期刊 计算机科学 学科 工学
关键词 中文开放式信息抽取 依存分析 实体关系抽取 机器学习 OIE word2vec
年,卷(期) 2017,(z1) 所属期刊栏目 智能计算
研究方向 页码范围 80-83
页数 4页 分类号 TP391.1
字数 4851字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王勇 太原理工大学计算机科学与技术学院 42 359 10.0 16.0
2 郝晓燕 太原理工大学计算机科学与技术学院 22 197 7.0 13.0
3 李颖 太原理工大学计算机科学与技术学院 10 68 5.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (38)
参考文献  (2)
节点文献
引证文献  (7)
同被引文献  (27)
二级引证文献  (15)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(15)
  • 引证文献(3)
  • 二级引证文献(12)
2020(4)
  • 引证文献(1)
  • 二级引证文献(3)
研究主题发展历程
节点文献
中文开放式信息抽取
依存分析
实体关系抽取
机器学习
OIE
word2vec
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学
月刊
1002-137X
50-1075/TP
大16开
重庆市渝北区洪湖西路18号
78-68
1974
chi
出版文献量(篇)
18527
总下载数(次)
68
论文1v1指导