基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
实体关系自动荻取是信息抽取的难题之一.本文提出自扩展算法和最大熵机器学习算法相结合的方法,以旅游领域为研究对象进行实体关系的自动抽取.首先利用自扩展算法自动获取能体现实体对间大类关系的语义词汇,该词汇作为特征加入最大熵机器学习算法的特征集,并设定阈值实现训练语料的自动标注;然后使用最大熵机器学习算法对训练语料进行学习,构建实体关系抽取的分类器,实现实体关系的自动获取.在收集600篇旅游领域语料的基础上进行实验,4大类实体关系的抽取获得了较好的结果,其中地理位置关系和时节关系的F值分别为82.56%和81.17%.实验结果表明:在人工干预较少的情况下,加入实体对间的语义词汇能有效提高抽取效果.
推荐文章
基于特征选择的实体关系抽取
关系抽取
特征选择
信息增益
期望交叉熵
x2统计
基于最大熵的泰语句子级实体从属关系抽取
实体关系
实体从属关系抽取
汉泰双语平行句对
最大熵模型
特征模板
融合语句-实体特征与Bert的中文实体关系抽取模型
自然语言处理
关系抽取
深度学习
BERT
Transformer
基于种子自扩展的命名实体关系抽取方法
命名实体
关系抽取
自学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于自扩展与最大熵的领域实体关系自动抽取
来源期刊 山东大学学报(工学版) 学科 工学
关键词 实体关系抽取 最大熵 自扩展 特征
年,卷(期) 2010,(5) 所属期刊栏目
研究方向 页码范围 141-145
页数 分类号 TP391
字数 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (91)
参考文献  (4)
节点文献
引证文献  (5)
同被引文献  (29)
二级引证文献  (12)
1996(2)
  • 参考文献(1)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(2)
  • 参考文献(2)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(3)
  • 引证文献(2)
  • 二级引证文献(1)
2015(2)
  • 引证文献(0)
  • 二级引证文献(2)
2016(3)
  • 引证文献(1)
  • 二级引证文献(2)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(4)
  • 引证文献(1)
  • 二级引证文献(3)
2019(3)
  • 引证文献(0)
  • 二级引证文献(3)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
实体关系抽取
最大熵
自扩展
特征
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
山东大学学报(工学版)
双月刊
1672-3961
37-1391/T
大16开
济南市经十路17923号
24-221
1956
chi
出版文献量(篇)
3095
总下载数(次)
14
总被引数(次)
24236
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导