基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对日益突出的网页访问问题,设计了一种新型分布式Web Spider.该分布式Web Spider采用中央控制节点来协调各个web spider的行为,利用宽度优先搜索来获得高质量的网页,通过对DNS缓存来提高访问web server的速度,以增加并行线程数量的方式来增加网页下载速度,并能动态地加入web spider节点和子中央控制节点,具有很强的灵活性和扩张能力.实验结果表明该分布式Web Spider作为搜索引擎的前端能够快速有效地下载网页,具有较好的性能.
推荐文章
新型分布式Web Spider的设计
中央控制节点
宽度优先搜索
线程
搜索引擎
基于Web的分布式计算
分布式对象技术
CORBA
面向对象数据库
Java
基于ProActive的分布式并行Web Spider设计
Web Spider程序
ProAetive中间件
并行
分布式
基于Web Services的分布式防火墙策略共享研究
分布式防火墙
Web Services
策略共享
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 采用多种策略的分布式Web Spider
来源期刊 计算机与数字工程 学科 工学
关键词 中央控制节点 宽度优先搜索 线程 搜索引擎
年,卷(期) 2012,(9) 所属期刊栏目 系统结构
研究方向 页码范围 63-65
页数 分类号 TP393
字数 2873字 语种 中文
DOI 10.3969/j.issn.1672-9722.2012.09.022
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 段红玉 郑州牧业工程高等专科学校信息工程系 17 34 4.0 5.0
2 陈炎龙 郑州牧业工程高等专科学校信息工程系 24 77 5.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (12)
共引文献  (31)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(3)
  • 参考文献(1)
  • 二级参考文献(2)
2009(4)
  • 参考文献(1)
  • 二级参考文献(3)
2010(2)
  • 参考文献(1)
  • 二级参考文献(1)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
中央控制节点
宽度优先搜索
线程
搜索引擎
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与数字工程
月刊
1672-9722
42-1372/TP
大16开
武汉市东湖新技术开发区凤凰产业园藏龙北路1号
1973
chi
出版文献量(篇)
9945
总下载数(次)
28
总被引数(次)
47579
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导