基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
大数据时代下,大规模采集Web数据的网络爬虫显得越来越重要.为解决爬虫IP的访问频率受限问题,提出了一种高可用动态代理池系统,从而解除IP访问频率限制,提高了网络爬虫性能.通过带有动态池系统的爬虫实验,验证了该系统的可行性与有效性.
推荐文章
面向移动终端的高可用后台系统的设计与实现
移动终端
高可用
后台系统
Keepalived
RSETful
API
一种新型网络爬虫的设计与实现
Socket
Http
网络爬虫
客户端/服务器
基于Web的网络爬虫的设计与实现
搜索引擎
网络爬虫
信息检索
页面索引
面向集群环境的高可用分布并行存储模型研究设计与实现
高可用
冗余
多级容错
相继失效
存储模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向网络爬虫的高可用动态池系统设计与实现
来源期刊 福建电脑 学科 工学
关键词 IP代理池 IP访问频率 网络爬虫 NoSQL
年,卷(期) 2019,(6) 所属期刊栏目 论著
研究方向 页码范围 8-11
页数 4页 分类号 TP393
字数 4240字 语种 中文
DOI 10.16707/j.cnki.fjpc.2019.06.002
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐海蛟 广东第二师范学院计算机科学系 10 7 1.0 2.0
2 何佳蕾 广东第二师范学院计算机科学系 5 2 1.0 1.0
3 王佳鹏 广东第二师范学院计算机科学系 3 2 1.0 1.0
4 许培宇 广东第二师范学院计算机科学系 1 1 1.0 1.0
5 林冠成 广东第二师范学院计算机科学系 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (78)
共引文献  (20)
参考文献  (11)
节点文献
引证文献  (1)
同被引文献  (4)
二级引证文献  (0)
1970(1)
  • 参考文献(0)
  • 二级参考文献(1)
1978(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(3)
  • 参考文献(1)
  • 二级参考文献(2)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(4)
  • 参考文献(0)
  • 二级参考文献(4)
2011(6)
  • 参考文献(0)
  • 二级参考文献(6)
2012(8)
  • 参考文献(1)
  • 二级参考文献(7)
2013(6)
  • 参考文献(0)
  • 二级参考文献(6)
2014(11)
  • 参考文献(1)
  • 二级参考文献(10)
2015(6)
  • 参考文献(0)
  • 二级参考文献(6)
2016(7)
  • 参考文献(0)
  • 二级参考文献(7)
2017(7)
  • 参考文献(1)
  • 二级参考文献(6)
2018(8)
  • 参考文献(5)
  • 二级参考文献(3)
2019(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(2)
  • 参考文献(2)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
IP代理池
IP访问频率
网络爬虫
NoSQL
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
福建电脑
月刊
1673-2782
35-1115/TP
大16开
福州市华林邮局29号信箱
1985
chi
出版文献量(篇)
21147
总下载数(次)
86
相关基金
广东省自然科学基金
英文译名:Guangdong Natural Science Foundation
官方网址:http://gdsf.gdstc.gov.cn/
项目类型:研究团队
学科类型:
论文1v1指导