基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对从非结构化文本中抽取指定人物职衔履历属性问题,提出一种基于远距离监督和模式匹配的属性抽取方法.该方法从字符串模式和依存模式两个层面描述人物职衔履历特征,将问题分为两阶段.首先利用远距离监督知识和人工标注知识,挖掘具有高覆盖度的模式库,用于发现职衔履历属性和抽取候选集;其次利用职衔机构等属性间的文字接续关系,以及特定人物与候选属性的依存关系,设计候选集的过滤规则对候选项进行筛选,实现高准确度的属性抽取.实验结果显示,所提方法在CLP2014-PAE测试集上的F值达到55.37%,显著高于评测最好成绩(F值34.38%)和基于条件随机场(CRF)的有监督序列标注方法(F值43.79%),表明该方法能高覆盖度挖掘并抽取非结构化文档中的职衔履历属性.
推荐文章
基于SRT技术的节目信号远距离传输
传输类型
SRT技术
远距离传输
基于弯曲振动超声换能器的远距离测量
弯曲振动
超声波传感器
陆地自主车
测距
基于FPGA的远距离测温器数控系统设计
远距离测温
FPGA
数据采集与控制系统
NiosⅡ
基于正交试验设计的交会远距离导引误差分析
燃油系统
流体仿真
入口流量
入口压力
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于远距离监督和模式匹配的职衔履历属性抽取
来源期刊 计算机应用 学科 工学
关键词 人物属性抽取 职衔履历信息 远距离监督 模式匹配 规则过滤
年,卷(期) 2016,(2) 所属期刊栏目 第三届CCF大数据学术会议(CCF BigData 2015)
研究方向 页码范围 455-459,464
页数 6页 分类号 TP391
字数 5862字 语种 中文
DOI 10.11772/j.issn.1001-9081.2016.02.0455
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 于东 北京语言大学大数据与语言教育研究所 12 49 4.0 6.0
5 刘春花 北京语言大学信息科学学院 1 3 1.0 1.0
6 田悦 北京语言大学信息科学学院 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (21)
参考文献  (6)
节点文献
引证文献  (3)
同被引文献  (18)
二级引证文献  (2)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(1)
  • 二级参考文献(1)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(3)
  • 引证文献(3)
  • 二级引证文献(0)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
人物属性抽取
职衔履历信息
远距离监督
模式匹配
规则过滤
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导