基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
网络技术的快速发展,网络爬虫技术也得到了广泛普及和应用.更多的用户开展运用网络爬虫技术去获取自身所需的信息,而过多的网络爬虫会对网站的运行造成一定的负担和压力.因此,信息时代背景下,为了更好的提升网站访问体验感和速度,降低网络爬虫技术给网络带来的影响,从而提出有效的反爬虫技术和手段,满足用户对各种数据和信息的需求,给人们提供一个良好的网络环境.本文根据网络爬虫的内涵,阐述了网站中常见的反爬虫技术,并且提出了网络爬虫应对"反爬"网站的爬取对策.这样能够从根源上去杜绝恶意爬虫去网址访问,这样对网址的稳定运行以及数据保护有着重要的作用和意义.
推荐文章
新浪微博数据爬取研究
新浪微博
数据爬取
微博爬虫
Python
基于EBNF和二次爬取策略的XSS漏洞检测技术
跨站脚本
扩展的巴科斯范式
攻击向量
渗透测试
网络监管系统爬网算法优化
网络监管系统
爬网算法
Internet控制报文协议
麋鹿同性爬跨的行为研究
麋鹿
同性爬跨
环境选择
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 网络爬虫针对"反爬"网站的爬取策略研究
来源期刊 数码世界 学科
关键词 网络爬虫 "反爬"网站 爬取策略
年,卷(期) 2020,(6) 所属期刊栏目 网络与安全
研究方向 页码范围 270
页数 1页 分类号
字数 2353字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 文成香 3 0 0.0 0.0
2 李璋林 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (15)
共引文献  (11)
参考文献  (4)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(2)
  • 参考文献(0)
  • 二级参考文献(2)
2015(2)
  • 参考文献(0)
  • 二级参考文献(2)
2016(4)
  • 参考文献(1)
  • 二级参考文献(3)
2017(1)
  • 参考文献(0)
  • 二级参考文献(1)
2018(1)
  • 参考文献(0)
  • 二级参考文献(1)
2019(5)
  • 参考文献(3)
  • 二级参考文献(2)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
网络爬虫
"反爬"网站
爬取策略
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数码世界
月刊
1671-8313
12-1344/TP
大16开
北京市海淀区永定路4号A院3号楼506室
6-167
2002
chi
出版文献量(篇)
22805
总下载数(次)
112
总被引数(次)
4543
论文1v1指导