基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
由于互联网具有海量信息并且快速增长,提高搜索引擎的信息采集器Web Spider的数据采集和更新速度有重要意义.受计算资源限制,单机多线程Web Spider的采集速率不高.带中心节点的分布式并行Web Spider又容易产生中心节点瓶颈问题.利用ProActive网格网络并行分布计算中间件提供的主动对象技术、网络并行计算技术、自动部署机制等设计和实现了一个名为P-Spider2.0的节点对等的分布式并行Web Spider,并设计了一个基于Raibin算法的URL去重算法.实验表明该Web Spider方便管理和部署,并且比单机多线程Web Spider具有更高的采集速率.
推荐文章
可扩展负载均衡Spider的设计
Spider
蜘蛛程序
负载均衡
分布式
对等式测控网的设计与实现
对等
测控
令牌
逻辑环
新型分布式Web Spider的设计
中央控制节点
宽度优先搜索
线程
搜索引擎
对等式令牌测控网络的设计与实现
对等式
即插即用
令牌
测控
逻辑环
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 节点对等Web Spider设计与实现
来源期刊 计算机技术与发展 学科 工学
关键词 网络爬虫 ProActive 并行 分布式 节点对等
年,卷(期) 2010,(3) 所属期刊栏目 应用开发研究
研究方向 页码范围 195-198,202
页数 5页 分类号 TP393
字数 4415字 语种 中文
DOI 10.3969/j.issn.1673-629X.2010.03.050
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张燕 辽宁石油化工大学计算机与通信工程学院 47 162 6.0 10.0
2 王红霞 北京青年政治学院计算机系 20 45 5.0 5.0
3 张林才 辽宁石油化工大学计算机与通信工程学院 5 32 2.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (12)
参考文献  (2)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
网络爬虫
ProActive
并行
分布式
节点对等
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导