基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
模式匹配是信息抽取系统通常使用的方法,如何生成信息抽取模式就成为信息抽取的关键问题.由于手工编写模式的代价太大,本文尝试采用聚类方法自动生成针对中文文本的信息抽取模式.通过计算模式实例间的相似度,采用单链法聚类,将模式实例划分为不同的类别,每个类别对应一个模式,将同一类别中的模式实例进行合并就可以得到最终的信息抽取模式.以农作物信息文本为实验语料,进行了聚类测试,错分率与漏分率分别为0.21%和1.07%,合并后的模式覆盖了人工分析提出的25类中的24类.
推荐文章
面向Deep Web数据自动抽取的模板生成方法
Deep,Web
数据抽取
模板生成
文法推断
基于多块模式决策的边信息生成方法
分布式视频编码
边信息
运动估计
Wyner-Ziv编码器
帧内插
MCTI算法
一种基于领域本体的课件自动生成方法
领域本体
课件
课件内容
课件自动生成
知识量
一种基于扩展对象模型的界面自动生成方法
扩展对象模型
用户交互对象
界面自动生成
布局
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 信息抽取模式自动生成方法的研究
来源期刊 中文信息学报 学科 工学
关键词 人工智能 自然语言处理 信息抽取 模式匹配 信息抽取模式
年,卷(期) 2004,(1) 所属期刊栏目
研究方向 页码范围 48-54
页数 7页 分类号 TP391
字数 5184字 语种 中文
DOI 10.3969/j.issn.1003-0077.2004.01.008
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郑家恒 山西大学计算机科学系 58 1189 16.0 33.0
2 李飞 山西大学计算机科学系 7 69 3.0 7.0
3 王兴义 山西大学计算机科学系 1 57 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (57)
同被引文献  (47)
二级引证文献  (206)
2004(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2005(4)
  • 引证文献(4)
  • 二级引证文献(0)
2006(4)
  • 引证文献(4)
  • 二级引证文献(0)
2007(7)
  • 引证文献(4)
  • 二级引证文献(3)
2008(16)
  • 引证文献(11)
  • 二级引证文献(5)
2009(10)
  • 引证文献(8)
  • 二级引证文献(2)
2010(15)
  • 引证文献(5)
  • 二级引证文献(10)
2011(26)
  • 引证文献(3)
  • 二级引证文献(23)
2012(22)
  • 引证文献(4)
  • 二级引证文献(18)
2013(19)
  • 引证文献(3)
  • 二级引证文献(16)
2014(20)
  • 引证文献(2)
  • 二级引证文献(18)
2015(15)
  • 引证文献(2)
  • 二级引证文献(13)
2016(17)
  • 引证文献(0)
  • 二级引证文献(17)
2017(30)
  • 引证文献(3)
  • 二级引证文献(27)
2018(30)
  • 引证文献(3)
  • 二级引证文献(27)
2019(22)
  • 引证文献(1)
  • 二级引证文献(21)
2020(6)
  • 引证文献(0)
  • 二级引证文献(6)
研究主题发展历程
节点文献
人工智能
自然语言处理
信息抽取
模式匹配
信息抽取模式
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
相关基金
国家高技术研究发展计划(863计划)
英文译名:The National High Technology Research and Development Program of China
官方网址:http://www.863.org.cn
项目类型:重点项目
学科类型:信息技术
论文1v1指导