原文服务方: 计算机应用研究       
摘要:
网页标题具有简洁、信息量大的特点,而且其中蕴涵了丰富、动态、复杂的人物关系.主要针对网页标题文本中的人物关系抽取进行研究,提出一种双模型投票的机器学习方法.针对19种关系类型分别进行特征抽取和选择;使用两种统计模型——最大熵和支持向量机分别进行模型训练;对于每种关系类型利用模型投票的方法,即选择训练集中得到性能较好的模型作为该类的模型,最后使用训练好的模型对测试集进行测试.结果显示,该方法对于人物关系抽取任务取得了总体F1值为67.64%的性能.
推荐文章
基于信息增益的 Web 人物关系抽取
关系抽取
信息增益
模板匹配
多分类
自然语言处理
基于条件随机场的人物信息抽取
CRFs
人物
人物信息
信息抽取
基于信息增益的 Web 人物关系抽取
关系抽取
信息增益
模板匹配
多分类
自然语言处理
基于规则的人物信息抽取算法的研究
文本信息抽取
人物信息抽取
人物属性规则
抽取算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于双模型投票的人物关系抽取研究
来源期刊 计算机应用研究 学科
关键词 关系抽取 最大熵模型 支持向量机 投票
年,卷(期) 2017,(3) 所属期刊栏目 系统应用开发
研究方向 页码范围 773-776
页数 4页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2017.03.031
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 林民 内蒙古师范大学计算机与信息工程学院 53 235 8.0 12.0
2 李艳玲 内蒙古师范大学计算机与信息工程学院 13 22 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (3)
参考文献  (6)
节点文献
引证文献  (4)
同被引文献  (24)
二级引证文献  (2)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(4)
  • 引证文献(2)
  • 二级引证文献(2)
研究主题发展历程
节点文献
关系抽取
最大熵模型
支持向量机
投票
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导