基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
微博作为新型的消息传播媒介,其影响力和传播速度都超越了传统主流媒体,预测微博热度对舆情监测、政府宣传、企业营销及热点推送等具有重要意义.通过分析微博转发的层次规律,结合转发量、转发深度及广度指标,定义新的热度指数计算方法.将微博热度划分为5个等级,对转发数大于100的微博预测其热度达到特定等级的概率.使用有监督的机器学习算法,先后提取训练样本的静态和动态特征训练热度预测模型.通过自主开发的BigData爬虫开放平台获取来源于新浪微博的训练样本,并应用十折交叉验证法进行实验,结果表明,相比只使用静态特征的热度预测模型,加入微博动态特征能有效提高预测性能,平均F1值达到76.9%.
推荐文章
基于SVM的微博转发规模预测方法
微博
转发行为
转发规模
新浪微博数据爬取研究
新浪微博
数据爬取
微博爬虫
Python
基于新浪微博的公交系统数据采集及分析
微博
公交系统
数据抓取
中文分词
大数据
新浪健康微博的文本分析
新浪微博
健康传播
文本分析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于转发层次分析的新浪微博热度预测研究
来源期刊 计算机工程 学科 工学
关键词 微博 爬虫 静态特征 动态特征 热度指数 多分类问题
年,卷(期) 2015,(7) 所属期刊栏目 先进计算与数据处理
研究方向 页码范围 31-35
页数 5页 分类号 TP311.5
字数 4872字 语种 中文
DOI 10.3969/j.issn.1000-3428.2015.07.006
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李海波 中国科学院高能物理研究所计算中心 201 4673 35.0 59.0
2 程耀东 中国科学院高能物理研究所计算中心 52 322 10.0 14.0
3 胡庆宝 中国科学院高能物理研究所计算中心 7 55 4.0 7.0
4 刘全明 山西大学计算机与信息技术学院 15 45 3.0 6.0
5 翟晓芳 山西大学计算机与信息技术学院 2 25 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (46)
共引文献  (93)
参考文献  (7)
节点文献
引证文献  (17)
同被引文献  (65)
二级引证文献  (38)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(3)
  • 参考文献(1)
  • 二级参考文献(2)
2011(9)
  • 参考文献(0)
  • 二级参考文献(9)
2012(21)
  • 参考文献(2)
  • 二级参考文献(19)
2013(12)
  • 参考文献(4)
  • 二级参考文献(8)
2015(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(5)
  • 引证文献(5)
  • 二级引证文献(0)
2018(16)
  • 引证文献(6)
  • 二级引证文献(10)
2019(24)
  • 引证文献(2)
  • 二级引证文献(22)
2020(6)
  • 引证文献(0)
  • 二级引证文献(6)
研究主题发展历程
节点文献
微博
爬虫
静态特征
动态特征
热度指数
多分类问题
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
论文1v1指导