作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了快速地获取到微博中人际关系信息,根据网址的特点,文章提出了一种基于新浪微博的爬虫程序设计方法.本方法通过模拟登录新浪微博,实现抓取微博中由指定用户出发的关注对象的名称等信息;该程序利用解析关键路径,广度遍历等技术,匹配符合规定条件的人物名称,并抓取相关内容;最后对该程序又进一步地优化与改进.实验结果表明:本程序具有针对性强,数据采集速度合理,易推广开发,稳定性强等优点,为寻求人际关系的研究者提供了寻求微博用户关注者的方法,有利于对微博的后续数据挖掘研究.
推荐文章
新浪微博数据爬取研究
新浪微博
数据爬取
微博爬虫
Python
基于Java的新浪微博爬虫研究与实现
新浪微博
网络爬虫
Java
数据挖掘
针对微博的免登录分布式网络爬虫的研究
免登录网络爬虫
分布式网络爬虫
Hadoop
MapReduce
基于Linux的python多线程爬虫程序设计
微博网页
网络爬虫
模拟登录
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于新浪微博的爬虫程序设计与实现
来源期刊 无线互联科技 学科
关键词 人际关系 新浪微博 模拟登录 关键路径 广度遍历
年,卷(期) 2018,(9) 所属期刊栏目 软件透视
研究方向 页码范围 40-42
页数 3页 分类号
字数 3588字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 胡海潮 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (25)
共引文献  (41)
参考文献  (8)
节点文献
引证文献  (1)
同被引文献  (3)
二级引证文献  (0)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(4)
  • 参考文献(1)
  • 二级参考文献(3)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(5)
  • 参考文献(0)
  • 二级参考文献(5)
2015(7)
  • 参考文献(2)
  • 二级参考文献(5)
2016(5)
  • 参考文献(5)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
人际关系
新浪微博
模拟登录
关键路径
广度遍历
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
无线互联科技
半月刊
1672-6944
32-1675/TN
16开
江苏省南京市
2004
chi
出版文献量(篇)
18145
总下载数(次)
78
总被引数(次)
27320
论文1v1指导