基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
KAD网络是目前基于实际应用的一个最大的DHT网络,针对KAD网络的测量成为研究实际DHT的很好途径.各种针对覆盖网络的基于主动和被动的测量研究也正逐步展开,在主动测量中,网络爬虫是一项很重要的基础工作.通常,这类爬虫从一个起始的已知节点集开始扫描,然后通过迭代式地查询来获取更多的节点信息.设计爬虫的时候通常希望达到3个性能方面的目标:尽快完成对一个已知的节点集的扫描,尽可能抓取到更多的节点信息,尽量减少网络带宽的占用.由于这些目标之间存在互相制约关系,单纯优化其中的一项性能可能降低其它性能.文中提出了一个基本的DHT网络爬虫的框架,并提出基于该框架上可能的扩展,充分利用覆盖网络中的拓扑结构,对爬虫各部分工作的权重进行调整,从而降低爬虫总的工作量,达到对以上目标的优化.
推荐文章
基于HTMLParser信息提取的网络爬虫设计
网络爬虫
垂直搜索
HTMLParser
一种新型网络爬虫的设计与实现
Socket
Http
网络爬虫
客户端/服务器
BGP关键特征及设计可扩展的IBGP网络
边界网关路由协议
自治系统
内部网关路由协议
路由反射器
基于WebKit的网络爬虫
网络爬虫
浏览器引擎
WebKit
JavaScript
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 可扩展的DHT网络爬虫设计和优化
来源期刊 中国科学(信息科学) 学科 工学
关键词 DHT 爬虫 网络测量
年,卷(期) 2010,(9) 所属期刊栏目
研究方向 页码范围 1211-1222
页数 12页 分类号 TP391.3
字数 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
DHT
爬虫
网络测量
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国科学(信息科学)
月刊
1674-7267
11-5846/N
北京东黄城根北街16号
chi
出版文献量(篇)
1697
总下载数(次)
4
总被引数(次)
13096
论文1v1指导