基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文介绍了一个大型分布式Web Crawler系统--Igloo 1.2版.它采用分布式的系统结构,通过我们设计的二级哈希映射算法使系统可以进行高效的任务分割,并且系统的规模动态可扩展.爬行网页的质量是评价Crawler的一个重要指标,Igloo以PageRank值作为网页质量评价的标准,从而提高了爬行质量.加快爬行速度的关键是如何解除Crawler系统中的性能瓶颈,本文对此也作了详细的讨论,并提出了一种基于"滞后合并"策略的URL数据库存取方法.实验表明,Igloo在保持高性能的同时能快速爬行到高质量的网页.
推荐文章
基于Web Services的分布式防火墙策略共享研究
分布式防火墙
Web Services
策略共享
基于Web的分布式计算
分布式对象技术
CORBA
面向对象数据库
Java
构建基于XML的Web分布式体系结构
Web
XML
Windows DNA
3层体系结构
基于CORBA的分布式Web数据库系统结构
分布式数据库
Web数据库
公共对象请求代理体系结构
客户/服务器
对象Web
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 分布式Web Crawler的研究:结构、算法和策略
来源期刊 电子学报 学科 工学
关键词 Web爬虫 爬行策略 分布式系统
年,卷(期) 2002,(z1) 所属期刊栏目 学术论文
研究方向 页码范围 2008-2011
页数 4页 分类号 TP391|TP393
字数 3948字 语种 中文
DOI 10.3321/j.issn:0372-2112.2002.z1.023
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 马范援 上海交通大学计算机科学与工程系 64 1043 18.0 31.0
2 宋晖 上海交通大学计算机科学与工程系 4 172 4.0 4.0
3 张岭 上海交通大学计算机科学与工程系 6 274 6.0 6.0
4 叶允明 上海交通大学计算机科学与工程系 3 164 3.0 3.0
5 于水 上海交通大学计算机科学与工程系 15 426 11.0 15.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (83)
同被引文献  (56)
二级引证文献  (333)
1960(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2004(3)
  • 引证文献(3)
  • 二级引证文献(0)
2005(2)
  • 引证文献(2)
  • 二级引证文献(0)
2006(5)
  • 引证文献(5)
  • 二级引证文献(0)
2007(6)
  • 引证文献(5)
  • 二级引证文献(1)
2008(9)
  • 引证文献(6)
  • 二级引证文献(3)
2009(16)
  • 引证文献(6)
  • 二级引证文献(10)
2010(25)
  • 引证文献(8)
  • 二级引证文献(17)
2011(20)
  • 引证文献(5)
  • 二级引证文献(15)
2012(34)
  • 引证文献(2)
  • 二级引证文献(32)
2013(29)
  • 引证文献(3)
  • 二级引证文献(26)
2014(27)
  • 引证文献(2)
  • 二级引证文献(25)
2015(45)
  • 引证文献(8)
  • 二级引证文献(37)
2016(60)
  • 引证文献(10)
  • 二级引证文献(50)
2017(42)
  • 引证文献(5)
  • 二级引证文献(37)
2018(49)
  • 引证文献(6)
  • 二级引证文献(43)
2019(31)
  • 引证文献(7)
  • 二级引证文献(24)
2020(13)
  • 引证文献(0)
  • 二级引证文献(13)
研究主题发展历程
节点文献
Web爬虫
爬行策略
分布式系统
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子学报
月刊
0372-2112
11-2087/TN
大16开
北京165信箱
2-891
1962
chi
出版文献量(篇)
11181
总下载数(次)
11
总被引数(次)
206555
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导