基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
海量的URL快速文件系统建立的目标就是提供高速的处理机制,此时以高性能的web爬虫为基础的系统可以帮助实现这个目标.为了实现这个快速目标,URL往往将被保存在一个专业数据库中,但数据量的增加会给爬虫技术带来巨大的压力,关系数据库往往不能满足爬虫对海量URL的存储需求.本文所研究的是数据规模增加是如何打破web爬虫的技术瓶颈,从而使得系统获得更加优化的利用效果与速度的.
推荐文章
网络文件系统中的元数据存取优化研究
机群文件系统
文件元数据
全路径解析
针对海量小文件的可伸缩分布式文件系统研究
可伸缩性
分布式系统
文件系统
小文件
基于μC/OS-Ⅱ的文件系统设计
实时嵌入式系统
μC/OS-Ⅱ
文件系统
基于文件系统过滤驱动的文件加密系统设计
信息安全
文件监控
文件系统过滤驱动
文件加密
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于海量URL数据存取的快速文件系统设计分析
来源期刊 信息通信 学科 工学
关键词 海量URL web爬虫 爬行策略 系统构建 系统模块
年,卷(期) 2012,(6) 所属期刊栏目 信息工程
研究方向 页码范围 89-90
页数 2页 分类号 TP393.01
字数 3099字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 卫锋 4 0 0.0 0.0
2 刘烜 4 0 0.0 0.0
3 苏庆华 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (24)
共引文献  (16)
参考文献  (8)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(5)
  • 参考文献(1)
  • 二级参考文献(4)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(2)
  • 参考文献(2)
  • 二级参考文献(0)
2009(3)
  • 参考文献(2)
  • 二级参考文献(1)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
海量URL
web爬虫
爬行策略
系统构建
系统模块
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息通信
月刊
1673-1131
42-1739/TN
大16开
湖北省武汉市
1987
chi
出版文献量(篇)
18968
总下载数(次)
92
总被引数(次)
34323
论文1v1指导