基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着Internet的发展,Web挖掘技术越来越重要,其中的Web信息抽取技术逐渐成为热点,逐渐成为Web挖掘技术的关键技术之一,对Web信息抽取技术的深入研究也为构建更好的面向主题的搜索引擎提供了思路.文中对Web信息抽取的现有技术以及现有技术存在的问题进行了详细的论述.根据Web信息抽取的原理,依据软件工程的观点对Web信息抽取技术提出了具有指导意义的8条启发式规则.在这些规则的指导下,着重阐述了Web信息抽取中的基于结构和内容的信息抽取.通过理论分析及相应的实验说明所提出的8条规则对Web信息抽取具有良好的指导意义.
推荐文章
基于启发式规则的网页主题信息精确定位方法
启发式规则
信息抽取
主题信息定位
模板化网页
基于启发式信息的Deep Web结果模式获取方法
Deep Web
结果模式
网页数据特征矩阵
启发式信息
传统启发式教学与现代启发式教学之对比研究
传统启发式
现代启发式
对比研究
基于Rough集的启发式约简中启发式规则比较研究
Rough集
启发式规则
属性重要性
启发式约简算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于启发式规则的Web信息抽取技术研究
来源期刊 计算机技术与发展 学科 工学
关键词 Web信息抽取 网页过滤 启发式规则
年,卷(期) 2009,(8) 所属期刊栏目 智能、算法、系统工程
研究方向 页码范围 4-7
页数 4页 分类号 TP311
字数 3919字 语种 中文
DOI 10.3969/j.issn.1673-629X.2009.08.002
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 毛宇光 南京航空航天大学信息科学与技术学院 63 414 10.0 17.0
5 廉成洋 南京航空航天大学信息科学与技术学院 2 6 2.0 2.0
6 黄玉明 南京航空航天大学信息科学与技术学院 2 13 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (13)
共引文献  (119)
参考文献  (6)
节点文献
引证文献  (4)
同被引文献  (3)
二级引证文献  (0)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(4)
  • 参考文献(1)
  • 二级参考文献(3)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(2)
  • 参考文献(2)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Web信息抽取
网页过滤
启发式规则
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导