作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
新浪微博每日活跃用户数超过5000万,是规模巨大的数据产生源。本文提出了新浪微博关键词数据抓取方案,主要解决如何根据指定关键词,利用网络爬虫,从新浪微博抓取指定时间段的数据。
推荐文章
新浪微博数据爬取研究
新浪微博
数据爬取
微博爬虫
Python
基于新浪微博的公交系统数据采集及分析
微博
公交系统
数据抓取
中文分词
大数据
基于新浪微博API的话题分析系统
微博
话题分析
数据挖掘
API
新浪健康微博的文本分析
新浪微博
健康传播
文本分析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 新浪微博数据抓取——高级搜索
来源期刊 信息与电脑:理论版 学科 工学
关键词 网络爬虫 指定时间 MYSQL COOKIE 分布式系统 个人电脑 正则表达式 功能描述 社交网络
年,卷(期) 2013,(11) 所属期刊栏目
研究方向 页码范围 54-55
页数 2页 分类号 TP391.3
字数 语种
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张洪辰 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
网络爬虫
指定时间
MYSQL
COOKIE
分布式系统
个人电脑
正则表达式
功能描述
社交网络
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息与电脑(理论版)
月刊
1003-9767
11-2697/TP
大16开
82-454
2007
chi
出版文献量(篇)
11272
总下载数(次)
57
总被引数(次)
46393
论文1v1指导