基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
微博(Micro Blog),即微型博客,是博客的微型化,允许用户使用最多140字来向外发布消息,实现即时共享.web2.0时代微博已成为重要的网络信息来源,充分利用微博信息对舆情观测、情感倾向分析、热点识别等具有重要意义,如何快速有效抓取微博数据成为研究热点.本文分析对比了几种微博数据抓取方法并实现了基于代理IP的微博数据抓取方法,实验测试表明,该方法能够比较快速有效地采集新浪微博信息.
推荐文章
新浪微博数据爬取研究
新浪微博
数据爬取
微博爬虫
Python
微博信息可信度评估的数据起源方法
微博
可信度
数据起源
PROV模型
基于新浪微博的公交系统数据采集及分析
微博
公交系统
数据抓取
中文分词
大数据
基于大数据分析方法的微博热点建模与预测
微博热点分析
网络管理
大数据分析
预测模型
微博热点建模
预测效率
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 几种微博数据抓取方法比较研究
来源期刊 数字技术与应用 学科 工学
关键词 新浪微博 信息采集 代理IP 模拟登录API
年,卷(期) 2015,(4) 所属期刊栏目 应用研究
研究方向 页码范围 53-54
页数 2页 分类号 TN915.08
字数 1727字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 莫诗清 南京理工大学泰州科技学院 1 5 1.0 1.0
2 孙同陈 南京理工大学泰州科技学院 1 5 1.0 1.0
3 毛平 南京理工大学泰州科技学院 17 47 4.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (1)
参考文献  (2)
节点文献
引证文献  (5)
同被引文献  (7)
二级引证文献  (2)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(3)
  • 参考文献(1)
  • 二级参考文献(2)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(3)
  • 引证文献(3)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
新浪微博
信息采集
代理IP
模拟登录API
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数字技术与应用
月刊
1007-9416
12-1369/TN
16开
天津市
6-251
1983
chi
出版文献量(篇)
20434
总下载数(次)
106
总被引数(次)
35701
论文1v1指导