基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对日益突出的网页访问问题,设计了一种新型分布式Web Spider.该分布式wleb Spider采用中央控制节点来协调各个web spider的行为,利用宽度优先搜索来获得高质量的网页,通过对DNS缓存来提高访问web SerVer的速度,以增加并行线程数量的方式来增加网页下载速度,并能动态地加入web spider节点和子中央控制节点,具有很强的灵活性和扩张能力,实验结果表明该分布式Web Spider作为搜索引擎的前端能够快速有效地下载网页,具有较好的性能.
推荐文章
基于ProActive的分布式并行Web Spider设计
Web Spider程序
ProAetive中间件
并行
分布式
采用多种策略的分布式Web Spider
中央控制节点
宽度优先搜索
线程
搜索引擎
分布式Web系统的设计研究
分布式Web系统
XML
ASP
中间件
可扩展负载均衡Spider的设计
Spider
蜘蛛程序
负载均衡
分布式
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 新型分布式Web Spider的设计
来源期刊 计算机工程与应用 学科 工学
关键词 中央控制节点 宽度优先搜索 线程 搜索引擎
年,卷(期) 2011,(16) 所属期刊栏目 网络、通信、安全
研究方向 页码范围 80-82
页数 分类号 TP301
字数 2800字 语种 中文
DOI 10.3778/j.issn.1002-8331.2011.16.025
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 何绍荣 四川理工学院计算机学院 5 34 3.0 5.0
2 鲜乾坤 四川理工学院计算机学院 8 34 3.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (14)
参考文献  (3)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
中央控制节点
宽度优先搜索
线程
搜索引擎
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导