基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目的 自动从新浪微博中抓取含指定关键词的相关微博,通过对抓取的微博进行分析,得到相关舆情热点.方法 首先通过多线程爬虫,自动爬取含有指定关键字的微博,将其保存于数据库中,再采用基于字符串匹配的逆向最大匹配法对微博进行分词,计算各分词项的TF-IDF权重作为文本聚类的输入数据,最后用k-means算法进行聚类分析,得出舆情热点.结果与结论 这种方法能自动从新浪微博中抓取含指定关键词的相关微博,通过聚类分析,每一族的微博内容具有较高的一致性和共同的主题,由此可迅速找出热点舆情,对及时了解和引导舆情具有积极的意义.
推荐文章
基于微博的网络舆情分析系统设计
向量空间模型
TF-IDF
话题发现
舆情分析
新浪微博数据爬取研究
新浪微博
数据爬取
微博爬虫
Python
基于新浪微博的2018年云南通海5.0级地震舆情时空特征分析
通海地震
新浪微博
时空分布特征
情感分析
探索舆情传播规律,助力微博疏导舆情
微博舆情
舆情传播
疏导机制
舆情研判
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 含关键字的新浪微博获取与舆情分析
来源期刊 宝鸡文理学院学报(自然科学版) 学科 工学
关键词 微博 爬虫 聚类 舆情
年,卷(期) 2014,(1) 所属期刊栏目
研究方向 页码范围 51-54
页数 4页 分类号 TP391.1
字数 2571字 语种 中文
DOI 10.13467/j.cnki.jbuns.2014.01.006
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 江林升 23 81 5.0 8.0
2 张春霞 11 60 5.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (42)
共引文献  (57)
参考文献  (9)
节点文献
引证文献  (6)
同被引文献  (37)
二级引证文献  (1)
1966(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(6)
  • 参考文献(0)
  • 二级参考文献(6)
2006(6)
  • 参考文献(1)
  • 二级参考文献(5)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(9)
  • 参考文献(0)
  • 二级参考文献(9)
2010(8)
  • 参考文献(2)
  • 二级参考文献(6)
2011(4)
  • 参考文献(2)
  • 二级参考文献(2)
2012(3)
  • 参考文献(3)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
微博
爬虫
聚类
舆情
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
宝鸡文理学院学报(自然科学版)
季刊
1007-1261
61-1290/N
大16开
陕西省宝鸡市宝光路44号
1979
chi
出版文献量(篇)
1784
总下载数(次)
13
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导