基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题.为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍.首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析.在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础.
推荐文章
主题网络爬虫研究综述
主题网络爬虫
信息检索
Web挖掘
主题爬虫技术研究综述
网络爬虫
主题爬虫
相似度
网页内容
链接分析
深层网站Ajax页面数据采集研究综述
Ajax
深层网
Web 2.0
数据采集
主题网络爬虫研究综述
主题网络爬虫
主题爬虫
搜索引擎
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 深层网络爬虫研究综述
来源期刊 计算机系统应用 学科 工学
关键词 深层网络 网络爬虫 信息检索 URL 动态网页
年,卷(期) 2008,(5) 所属期刊栏目 专论·综述
研究方向 页码范围 122-126
页数 5页 分类号 TP3
字数 5427字 语种 中文
DOI 10.3969/j.issn.1003-3254.2008.05.033
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李淼 中国科学院合肥智能机械研究所 155 1490 17.0 35.0
2 曾伟辉 中国科学院合肥智能机械研究所 7 136 4.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (26)
共引文献  (170)
参考文献  (12)
节点文献
引证文献  (110)
同被引文献  (66)
二级引证文献  (483)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(4)
  • 参考文献(0)
  • 二级参考文献(4)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(3)
  • 参考文献(1)
  • 二级参考文献(2)
2004(9)
  • 参考文献(2)
  • 二级参考文献(7)
2005(5)
  • 参考文献(1)
  • 二级参考文献(4)
2006(6)
  • 参考文献(2)
  • 二级参考文献(4)
2007(6)
  • 参考文献(5)
  • 二级参考文献(1)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2009(7)
  • 引证文献(7)
  • 二级引证文献(0)
2010(11)
  • 引证文献(10)
  • 二级引证文献(1)
2011(22)
  • 引证文献(10)
  • 二级引证文献(12)
2012(28)
  • 引证文献(11)
  • 二级引证文献(17)
2013(29)
  • 引证文献(9)
  • 二级引证文献(20)
2014(47)
  • 引证文献(8)
  • 二级引证文献(39)
2015(65)
  • 引证文献(15)
  • 二级引证文献(50)
2016(78)
  • 引证文献(13)
  • 二级引证文献(65)
2017(101)
  • 引证文献(11)
  • 二级引证文献(90)
2018(104)
  • 引证文献(6)
  • 二级引证文献(98)
2019(81)
  • 引证文献(7)
  • 二级引证文献(74)
2020(20)
  • 引证文献(3)
  • 二级引证文献(17)
研究主题发展历程
节点文献
深层网络
网络爬虫
信息检索
URL
动态网页
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
论文1v1指导