作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着互联网大数据技术的不断发展,网络数据采集技术成为热门的研究领域之一.基于Python语言下的数据采集功能库如Urllib、Requests、Selenium等模块效率低、易阻塞,并且目前的数据采集和分析平台都是独立的功能模块,没有形成闭环,用户体验差.为了解决上述问题,提出一种数据采集和分析平台,首先使用Scrapy框架完成数据采集,其次将采集到的数据通过Kettle工具进行数据清洗,再次,将处理好的结果存入MySQL数据库,最后利用Flask框架,结合Echarts技术搭建Web系统,对数据分析结果进行可视化.以北京公交网站数据作为爬虫测试平台,通过对公交线路类型、公交路线等信息进行采集分析及结果展示,分析结果对城市公交的规划具有一定的指导意义,同时,平台具有稳定可靠、操作简单、实时性强等特点.
推荐文章
一种高速数据采集系统的设计与实现
数据采集
乒乓操作
现场可编程逻辑门阵列
一种基于FPGA+DSP的数据采集与处理平台
FPGA
DSP
低通滤波
CORDIC算法
一种新型数据采集控制系统平台设计
嵌入式系统
ARM9
数据采集
一种工业控制数据采集系统硬件平台设计
工业控制系统
AT91RM9200
数据采集系统
硬件平台
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种数据采集与分析平台的研究与设计
来源期刊 电脑与电信 学科 工学
关键词 Scrapy数据采集 Kettle数据清洗 MySQL Web系统 Flask Echarts
年,卷(期) 2021,(11) 所属期刊栏目 应用技术与研究
研究方向 页码范围 90-94
页数 5页 分类号 TP311.13
字数 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Scrapy数据采集
Kettle数据清洗
MySQL
Web系统
Flask
Echarts
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电脑与电信
月刊
1008-6609
44-1606/TN
大16开
广州市连新路171号国际科技中心B108室
1995
chi
出版文献量(篇)
8962
总下载数(次)
13
总被引数(次)
9565
论文1v1指导