基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着大数据时代的来临,大数据在日常生活中的应用显得尤为重要.如何便捷、快速地获取数据将成为提高竞争力的重要手段,而通过网络爬虫这一新兴技术能够非常高效的获取网络中的数据.但是如果不对爬虫进行控制,爬虫也会对网站造成巨大危害.为了减少网络爬虫对于网站的危害,详细阐述了网络爬虫的工作原理、种类以及URL的搜索策略,针对某些网站的"反爬"措施,提出相应的提出几种反爬策略.从而减轻了网站服务器压力,保护了数据,防止数据的大量流失.
推荐文章
基于Scrapy框架的爬虫和反爬虫研究
网站
网络爬虫
反爬虫
Python
Scrapy框架
多Agent主题爬虫协作策略的研究与分析
信息获取
主题爬虫
概念背景图
协作与竞争
基于网站访问行为的匿名爬虫检测
网络爬虫
网络机器人排斥协议
网站访问行为
匿名爬虫检测
基于Heritrix的面向电子商务网站增量爬虫研究
Heritrix
增量抓取
爬行策略
电子商务
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 网站反爬虫策略的分析与研究
来源期刊 电脑知识与技术 学科 工学
关键词 大数据 网络爬虫 爬虫 反爬措施 反爬策略
年,卷(期) 2019,(28) 所属期刊栏目 网络通讯及安全
研究方向 页码范围 28-30
页数 3页 分类号 TP393
字数 3172字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 伏康 山东财经大学管理科学与工程学院 2 3 1.0 1.0
2 杜振鹏 山东财经大学管理科学与工程学院 2 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (11)
共引文献  (20)
参考文献  (4)
节点文献
引证文献  (3)
同被引文献  (17)
二级引证文献  (0)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(2)
  • 参考文献(0)
  • 二级参考文献(2)
2015(2)
  • 参考文献(0)
  • 二级参考文献(2)
2016(3)
  • 参考文献(2)
  • 二级参考文献(1)
2017(1)
  • 参考文献(0)
  • 二级参考文献(1)
2018(1)
  • 参考文献(0)
  • 二级参考文献(1)
2019(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(2)
  • 参考文献(2)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(3)
  • 引证文献(3)
  • 二级引证文献(0)
研究主题发展历程
节点文献
大数据
网络爬虫
爬虫
反爬措施
反爬策略
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电脑知识与技术
旬刊
1009-3044
34-1205/TP
大16开
安徽省合肥市
26-188
1994
chi
出版文献量(篇)
58241
总下载数(次)
228
总被引数(次)
132128
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导