原文服务方: 计算机应用研究       
摘要:
地址抽取是信息采集研究的热点,但是如何保证高准确率与召回率一直是一个具有挑战性的问题.将基于CRF的方法与规则抽取方法相结合来进行地址抽取,并将优化后的结果再用来进行CRF训练;此过程不断循环迭代,直至性能不再提升,最后得到多个CRF分类器.这个不断迭代的过程就是基于群集智能的ACG算法流程,最后再通过组合多个分类器的结果形成最终结果.实验表明,该方法可以把召回率和准确率分别提高到96.44%和97.73%.
推荐文章
双层 CRF与规则相结合的中文地名识别方法研究
自然语言处理
中文地名识别
双层CRF模型
规则
基于BiLSTM-CRF的中文生物医学开放式概念关系抽取
开放式关系抽取
生物医学概念识别
BiLSTM-CRF
条件随机场
长短时记忆网络
基于规则与词典的地址匹配算法
地名
地址要素
地址模型
地址匹配
CRF与规则相结合的医学病历实体识别
电子病历
病历实体
命名实体识别
条件随机场
决策树
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于群集智能的CRF与规则结合的中文地址抽取
来源期刊 计算机应用研究 学科
关键词 条件随机场 地址抽取 规则抽取方法 群集智能 ACG算法 组合
年,卷(期) 2015,(3) 所属期刊栏目 算法研究探讨
研究方向 页码范围 727-730
页数 4页 分类号 TP391.43
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2015.03.020
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 姬东鸿 武汉大学计算机学院 92 887 16.0 26.0
2 汪闯闯 武汉大学计算机学院 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (22)
参考文献  (6)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
条件随机场
地址抽取
规则抽取方法
群集智能
ACG算法
组合
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导