基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
系统运用Python语言克服新浪微博反爬虫问题,使用Scrapy框架实现了高效、稳定的微博用户信息爬虫程序,全面获取用户在微博中的基本信息,并导入Neo4j图数据库和Echarts数据可视化库进行人物关系分析和挖掘.此外,系统针对微博中存在大量"网络水军"的现状设置了过滤选项,可以有效排除"网络水军"非正常行为对分析结果的影响.系统调试结果表明,系统能够实现对特定微博下转发、评论用户信息的实时、稳定、高效采集与分析,有效帮助人们从海量数据中提取复杂的关联关系,简洁、直观地分析微博用户之间的交互关系.
推荐文章
基于微博数据采集的W eb信息集成系统研究
Web信息集成
微博数据采集
气候变化
信息推送
基于新浪微博的公交系统数据采集及分析
微博
公交系统
数据抓取
中文分词
大数据
社交网络中微博用户行为的分析与预测
社会网络
微博
转发行为
预测
基于Oauth 2.0的微博信息采集系统的设计
信息采集
新浪微博
微博API
线程池
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 微博用户信息采集分析系统设计与实现
来源期刊 软件导刊 学科 工学
关键词 新浪微博 网络爬虫 模拟登录 数据分析
年,卷(期) 2019,(9) 所属期刊栏目 软件设计与开发
研究方向 页码范围 125-129
页数 5页 分类号 TP319
字数 4225字 语种 中文
DOI 10.11907/rjdk.191139
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 夏玲玲 江苏警官学院计算机信息与网络安全系 3 0 0.0 0.0
2 王沁 江苏警官学院计算机信息与网络安全系 2 0 0.0 0.0
3 张扬 江苏警官学院计算机信息与网络安全系 2 0 0.0 0.0
4 陈俊安 江苏警官学院计算机信息与网络安全系 2 0 0.0 0.0
5 范岩 江苏警官学院计算机信息与网络安全系 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (76)
共引文献  (115)
参考文献  (19)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(5)
  • 参考文献(1)
  • 二级参考文献(4)
2012(7)
  • 参考文献(0)
  • 二级参考文献(7)
2013(11)
  • 参考文献(0)
  • 二级参考文献(11)
2014(12)
  • 参考文献(0)
  • 二级参考文献(12)
2015(16)
  • 参考文献(0)
  • 二级参考文献(16)
2016(12)
  • 参考文献(3)
  • 二级参考文献(9)
2017(12)
  • 参考文献(7)
  • 二级参考文献(5)
2018(8)
  • 参考文献(8)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
新浪微博
网络爬虫
模拟登录
数据分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件导刊
月刊
1672-7800
42-1671/TP
16开
湖北省武汉市
38-431
2002
chi
出版文献量(篇)
9809
总下载数(次)
57
总被引数(次)
30383
论文1v1指导