基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对从非结构化文本中抽取指定人物职衔履历属性问题,提出一种基于远距离监督和模式匹配的属性抽取方法.该方法从字符串模式和依存模式两个层面描述人物职衔履历特征,将问题分为两阶段.首先利用远距离监督知识和人工标注知识,挖掘具有高覆盖度的模式库,用于发现职衔履历属性和抽取候选集;其次利用职衔机构等属性间的文字接续关系,以及特定人物与候选属性的依存关系,设计候选集的过滤规则对候选项进行筛选,实现高准确度的属性抽取.实验结果显示,所提方法在CLP2014-PAE测试集上的F值达到55.37%,显著高于评测最好成绩(F值34.38%)和基于条件随机场(CRF)的有监督序列标注方法(F值43.79%),表明该方法能高覆盖度挖掘并抽取非结构化文档中的职衔履历属性.
推荐文章
基于模式匹配与半监督学习的评价对象抽取
评价对象
意见挖掘
词性搭配
词性距离相关性算法
模式匹配
有效评价句
基于弱监督学习的主页人物属性抽取方法
人物属性抽取
前导词
属性模式
分类模型
bootstrapping
基于Web的远距离考试系统
远距离考试
自动评卷
客户机/服务器
Web-based
我国现代远距离开放教育新模式之探讨
远距离教育
开放大学
新模式
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于远距离监督和模式匹配的职衔履历属性抽取
来源期刊 计算机应用 学科 工学
关键词 人物属性抽取 职衔履历信息 远距离监督 模式匹配 规则过滤
年,卷(期) 2016,(2) 所属期刊栏目 第三届CCF大数据学术会议(CCF BigData 2015)
研究方向 页码范围 455-459,464
页数 6页 分类号 TP391
字数 5862字 语种 中文
DOI 10.11772/j.issn.1001-9081.2016.02.0455
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 于东 北京语言大学大数据与语言教育研究所 12 49 4.0 6.0
5 刘春花 北京语言大学信息科学学院 1 3 1.0 1.0
6 田悦 北京语言大学信息科学学院 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (21)
参考文献  (6)
节点文献
引证文献  (3)
同被引文献  (18)
二级引证文献  (2)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(1)
  • 二级参考文献(1)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(3)
  • 引证文献(3)
  • 二级引证文献(0)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
人物属性抽取
职衔履历信息
远距离监督
模式匹配
规则过滤
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
总被引数(次)
209512
论文1v1指导