基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对广域网环境下分布式Web爬虫的Agent协同和Web划分两个核心问题进行深入研究,提出了基于顾问服务的分布式Web爬虫系统模型,给出了详细的系统设计方案及Agent协同算法框架,并通过推导证明了顾问服务参与Agent协同能够使分布式爬虫系统承受相对较小的网络负载.提出了分布式Web爬虫Web划分的概念,围绕Web划分单元选取及Web划分策略,对Web划分的分类和实现进行了详细的讨论,并通过实验对多种Web划分方法进行了对比和评价,验证了广域网系统相对于局域网系统的优势,并发现运营商互连因素对爬虫系统性能的影响大于地理位置因素的影响.
推荐文章
广域网环境下分布式动漫渲染研究
广域网
分布式渲染
异构资源
监测
基于GNP算法的分布式爬虫调度策略
分布式爬虫
任务调度
负载均衡
网络测量
全局网络定位
基于Hadoop的广域网分布式主题爬虫系统框架
分布式爬虫
Hadoop
爬虫框架
模板匹配
主题爬虫
基于Agent实现组播在广域网中的传输
组播
Agent
组播域
广域网
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 广域网分布式爬虫中的Agent协同与Web划分研究
来源期刊 高技术通讯 学科 工学
关键词 分布式Web爬虫 Agent协同 Web划分 顾问服务
年,卷(期) 2010,(3) 所属期刊栏目 计算机与通信技术
研究方向 页码范围 239-245
页数 7页 分类号 TP3
字数 6106字 语种 中文
DOI 10.3772/j.issn.1002-0470.2010.03.004
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 方滨兴 哈尔滨工业大学计算机科学与技术学院 175 3885 33.0 56.0
2 张宏莉 哈尔滨工业大学计算机科学与技术学院 185 2778 29.0 46.0
3 张伟哲 哈尔滨工业大学计算机科学与技术学院 37 798 15.0 28.0
4 许笑 哈尔滨工业大学计算机科学与技术学院 5 114 4.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (22)
参考文献  (6)
节点文献
引证文献  (4)
同被引文献  (0)
二级引证文献  (0)
1960(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(1)
  • 二级参考文献(1)
1999(3)
  • 参考文献(1)
  • 二级参考文献(2)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(3)
  • 参考文献(1)
  • 二级参考文献(2)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
分布式Web爬虫
Agent协同
Web划分
顾问服务
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
高技术通讯
月刊
1002-0470
11-2770/N
大16开
北京市三里河路54号
82-516
1991
chi
出版文献量(篇)
5099
总下载数(次)
14
总被引数(次)
39217
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
国家高技术研究发展计划(863计划)
英文译名:The National High Technology Research and Development Program of China
官方网址:http://www.863.org.cn
项目类型:重点项目
学科类型:信息技术
高等学校博士学科点专项科研基金
英文译名:
官方网址:http://std.nankai.edu.cn/kyjh-bsd/1.htm
项目类型:面上课题
学科类型:
论文1v1指导