基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对Web数据采集技术进行了介绍,分析了Web数据采集技术在将非结构化数据转换为结构化数据方面的优势:速度快、准确性高。从HTTP协议层分析了Web数据抓取的原理,并重点介绍了如何实现基于Python的Web数据采集方案。Web数据采集系统可以分为:HTTP交互和数据解析两个模块。
推荐文章
基于Web的数据挖掘技术
数据挖掘
Web挖掘
信息提取
Web应用
个性化信息服务
基于Web远控的ARM数据采集系统研究与设计
工业以太网
数据采集系统
STM32F103ZET6
μC/OS-Ⅲ
LwIP
设计
基于Web数据挖掘技术研究
Web
数据挖掘
数据库
公共信息提取
基于Spring技术的油田生产数据采集系统
Spring容器
Struts框架
TWS系统
数据采集
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Python的Web数据采集技术
来源期刊 电子科技 学科 工学
关键词 Web数据抓取 屏幕抓取 HTTP协议 Python 正则表达式 XPath
年,卷(期) 2012,(11) 所属期刊栏目 专题综述
研究方向 页码范围 118-120
页数 3页 分类号 TP274.2
字数 2515字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李隐峰 西安电子科技大学电子工程学院 28 250 7.0 15.0
2 宋玉伟 西安电子科技大学电子工程学院 2 48 2.0 2.0
3 齐鹏 西安电子科技大学电子工程学院 5 52 2.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (2)
参考文献  (2)
节点文献
引证文献  (37)
同被引文献  (55)
二级引证文献  (69)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(4)
  • 引证文献(4)
  • 二级引证文献(0)
2015(9)
  • 引证文献(6)
  • 二级引证文献(3)
2016(10)
  • 引证文献(3)
  • 二级引证文献(7)
2017(12)
  • 引证文献(5)
  • 二级引证文献(7)
2018(24)
  • 引证文献(12)
  • 二级引证文献(12)
2019(31)
  • 引证文献(5)
  • 二级引证文献(26)
2020(15)
  • 引证文献(1)
  • 二级引证文献(14)
研究主题发展历程
节点文献
Web数据抓取
屏幕抓取
HTTP协议
Python
正则表达式
XPath
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子科技
月刊
1007-7820
61-1291/TN
大16开
西安电子科技大学
1987
chi
出版文献量(篇)
9344
总下载数(次)
32
总被引数(次)
31437
论文1v1指导