基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着计算机技术和internet的迅猛发展,信息和知识呈现爆炸性的增长,如何获取和利用信息成为现代社会提高竞争力的重要途径,网络爬虫是达到这一途径的重要工具。该文详细阐述了网络爬虫的体系结构、工作原理和URL搜索策略,针对某些网站采用的"反爬"措施,提出了几种爬取策略,以实现网页的有效爬取。对实际网络爬虫获取信息具有重要的参考价值。
推荐文章
新浪微博数据爬取研究
新浪微博
数据爬取
微博爬虫
Python
基于EBNF和二次爬取策略的XSS漏洞检测技术
跨站脚本
扩展的巴科斯范式
攻击向量
渗透测试
网络监管系统爬网算法优化
网络监管系统
爬网算法
Internet控制报文协议
麋鹿同性爬跨的行为研究
麋鹿
同性爬跨
环境选择
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 网络爬虫针对“反爬”网站的爬取策略研究
来源期刊 电脑知识与技术:学术交流 学科 工学
关键词 网络爬虫 反爬虫机制 搜索引擎
年,卷(期) 2016,(3) 所属期刊栏目
研究方向 页码范围 61-63
页数 3页 分类号 TP393
字数 语种
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (7)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
网络爬虫
反爬虫机制
搜索引擎
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电脑知识与技术:学术版
旬刊
1009-3044
34-1205/TP
安徽合肥市濉溪路333号
26-188
出版文献量(篇)
41621
总下载数(次)
23
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导