基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了解决传统网络爬虫对大型Web网站信息提取效率不高的问题,本文提出了一种引入Scrapy框架的Python网络爬虫提取方法.通过对主流网站进行信息提取,本文的方法显示出了较好的应用效果,实现了对大型经典网站的信息提取.
推荐文章
基于Scrapy框架的爬虫和反爬虫研究
网站
网络爬虫
反爬虫
Python
Scrapy框架
基于Scrapy框架的爬虫设计
Scrapy框架
爬虫
数据可视化
基于Scrapy的网络爬虫系统框架设计与实现
Scrapy
网络爬虫
系统框架设计
数据库设计
基于Python的网络爬虫研究
网络爬虫
Python
可视化
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 引入Scrapy框架的Python网络爬虫应用研究
来源期刊 福建电脑 学科
关键词 网络爬虫 Requests API Scrapy框架 反爬虫 Robots协议
年,卷(期) 2021,(10) 所属期刊栏目 研究与探讨|Exploration
研究方向 页码范围 58-60
页数 3页 分类号 TP391.3|TP312.1
字数 语种 中文
DOI 10.16707/j.cnki.fjpc.2021.10.015
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (231)
共引文献  (31)
参考文献  (15)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(7)
  • 参考文献(0)
  • 二级参考文献(7)
2009(6)
  • 参考文献(0)
  • 二级参考文献(6)
2010(15)
  • 参考文献(0)
  • 二级参考文献(15)
2011(13)
  • 参考文献(0)
  • 二级参考文献(13)
2012(7)
  • 参考文献(0)
  • 二级参考文献(7)
2013(22)
  • 参考文献(0)
  • 二级参考文献(22)
2014(18)
  • 参考文献(0)
  • 二级参考文献(18)
2015(29)
  • 参考文献(3)
  • 二级参考文献(26)
2016(20)
  • 参考文献(1)
  • 二级参考文献(19)
2017(30)
  • 参考文献(1)
  • 二级参考文献(29)
2018(30)
  • 参考文献(4)
  • 二级参考文献(26)
2019(18)
  • 参考文献(0)
  • 二级参考文献(18)
2020(14)
  • 参考文献(2)
  • 二级参考文献(12)
2021(5)
  • 参考文献(4)
  • 二级参考文献(1)
2021(5)
  • 参考文献(4)
  • 二级参考文献(1)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
网络爬虫
Requests API
Scrapy框架
反爬虫
Robots协议
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
福建电脑
月刊
1673-2782
35-1115/TP
大16开
福州市华林邮局29号信箱
1985
chi
出版文献量(篇)
21147
总下载数(次)
86
论文1v1指导