基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对互联网文本形式多样化造成的有效信息提取难度增加(尤其是命名实体识别方面)的问题,提出了一种统计和规则相结合的互联网文本命名实体识别方法.首先进行文本规范化,然后使用CRF模型,以词及词性作为特征进行训练,结合互联网文本的日常性、随意性和娱乐性等特点,以及若干匹配规则对文本进行命名实体识别.实验结果表明,该方法的准确率、召回率和F值分别达到了94.76%、85.34%、89.80%,能够有效地进行命名实体识别.
推荐文章
基于E-CNN和BLSTM-CRF的临床文本命名实体识别
命名实体识别
临床文本
集成的卷积神经网络
基于BLSTM-CRF中文领域命名实体识别框架设计
BLSTM-CRF
CBOW
Boson
命名实体识别
基于条件随机场的农业命名实体识别研究
农业命名实体识别
CRF模型
特征选择
基于深度学习的医疗命名实体识别
实体识别
数据挖掘
深度学习
医疗信息
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于CRF的互联网文本命名实体识别研究
来源期刊 中原工学院学报 学科 工学
关键词 命名实体识别 CRF 互联网文本 匹配规则 特征
年,卷(期) 2016,(1) 所属期刊栏目 信息技术
研究方向 页码范围 70-73,95
页数 5页 分类号 TP391
字数 3594字 语种 中文
DOI 10.3969/j.issn.1671-6906.2016.01.017
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郑秋生 75 412 12.0 16.0
2 刘守喜 1 6 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (45)
共引文献  (157)
参考文献  (11)
节点文献
引证文献  (6)
同被引文献  (19)
二级引证文献  (15)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(4)
  • 参考文献(0)
  • 二级参考文献(4)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(7)
  • 参考文献(2)
  • 二级参考文献(5)
2006(7)
  • 参考文献(0)
  • 二级参考文献(7)
2007(5)
  • 参考文献(1)
  • 二级参考文献(4)
2008(4)
  • 参考文献(2)
  • 二级参考文献(2)
2009(4)
  • 参考文献(1)
  • 二级参考文献(3)
2010(4)
  • 参考文献(0)
  • 二级参考文献(4)
2011(3)
  • 参考文献(0)
  • 二级参考文献(3)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(3)
  • 参考文献(2)
  • 二级参考文献(1)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(2)
  • 引证文献(0)
  • 二级引证文献(2)
2019(10)
  • 引证文献(3)
  • 二级引证文献(7)
2020(6)
  • 引证文献(0)
  • 二级引证文献(6)
研究主题发展历程
节点文献
命名实体识别
CRF
互联网文本
匹配规则
特征
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中原工学院学报
双月刊
1671-6906
41-1341/T
大16开
郑州市中原中路41号
36-173
1990
chi
出版文献量(篇)
2454
总下载数(次)
2
总被引数(次)
8847
论文1v1指导