基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了解决在线数据分析利用过程中的数据自动获取问题,提出基于PHP的爬虫程序设计方法.该方法利用PHP的cURL库获取整个页面文档,然后利用Simple HTML DOM分析器进行提取.按照该方法爬取了百度贴吧数据,结果符合设计要求.
推荐文章
百度贴吧用户兴趣分类
百度贴吧
K-Means算法
兴趣分类
基于百度CarLife的车联网娱乐系统功能测试
CarLife
车联网
娱乐系统
功能测试
新浪微博数据爬取研究
新浪微博
数据爬取
微博爬虫
Python
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于PHP的百度贴吧数据爬取
来源期刊 软件 学科 工学
关键词 网络爬虫 百度贴吧 PHP
年,卷(期) 2020,(11) 所属期刊栏目 基金项目论文
研究方向 页码范围 23-26
页数 4页 分类号 TP311.1
字数 语种 中文
DOI 10.3969/j.issn.1003-6970.2020.11.006
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (53)
共引文献  (9)
参考文献  (7)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(2)
  • 参考文献(0)
  • 二级参考文献(2)
2015(1)
  • 参考文献(0)
  • 二级参考文献(1)
2016(4)
  • 参考文献(1)
  • 二级参考文献(3)
2017(9)
  • 参考文献(0)
  • 二级参考文献(9)
2018(16)
  • 参考文献(1)
  • 二级参考文献(15)
2019(21)
  • 参考文献(5)
  • 二级参考文献(16)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
网络爬虫
百度贴吧
PHP
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件
月刊
1003-6970
12-1151/TP
16开
北京市3108信箱
1979
chi
出版文献量(篇)
9374
总下载数(次)
40
论文1v1指导