基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对传统的简历信息实体抽取方法泛化能力差、难以维护的问题,提出一种基于深层神经网络的简历信息实体抽取方法.经过数据清洗、分词等预处理将非结构化的简历文本信息处理为词序列,通过由Word2Vec在大规模语料库以无监督方式训练得到的词向量表,将每个词映射为低维实数向量,由双向LSTM层融合待标注词所处的语境信息,输出所有可能标签序列的分值给CRF层,由其引入前后标签之间的约束求解最优标签序列,以随机梯度下降法训练该模型,辅以Dropout防止过拟合.实验结果表明,该方法提升了相应的解析标注性能,提高了泛化能力.
推荐文章
基于深度学习的中文实体关系抽取方法
关系抽取
依存分析
最短依存路径
长短期记忆网络
卷积神经网络
基于Wikipedia的人名简历信息抽取
信息抽取
简历信息
关系元组
基于循环卷积神经网络的实体关系抽取方法研究
GRU
循环卷积神经网络
注意力机制
关系抽取
基于深度学习的医疗命名实体识别
实体识别
数据挖掘
深度学习
医疗信息
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于深度学习的简历信息实体抽取方法
来源期刊 计算机工程与设计 学科 工学
关键词 简历抽取 信息实体 序列标注 长短期记忆 条件随机场
年,卷(期) 2018,(12) 所属期刊栏目 开发与应用
研究方向 页码范围 3873-3878
页数 6页 分类号 TP391
字数 6470字 语种 中文
DOI 10.16208/j.issn1000-7024.2018.12.046
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 黄胜 重庆邮电大学光通信与网络重点实验室 109 262 8.0 10.0
2 李伟 重庆邮电大学光通信与网络重点实验室 14 25 3.0 5.0
3 张剑 北京大学深圳研究院 21 175 7.0 13.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
简历抽取
信息实体
序列标注
长短期记忆
条件随机场
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与设计
月刊
1000-7024
11-1775/TP
大16开
北京142信箱37分箱
82-425
1980
chi
出版文献量(篇)
18818
总下载数(次)
45
总被引数(次)
161677
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导