基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
微博社交网络短文本具有数据规模巨大、快速传播、模态多样、质量较低等特性,导致现有传统的话题检测与跟踪技术在对其进行数据处理时面临复杂度高、特征稀疏和噪声干扰等问题.为此,提出一种在回归预测和谱聚类基础上的突发话题检测方法.该方法针对关键词词频变动趋势,基于回归模型,量化微博关键词的突发程度,从词频趋势分析的角度准确地提取出突发词集合.设计一个基于谱聚类思想的突发词聚类方法提高聚类结果的准确性.在大规模微博数据集的实验结果证明,与baseline方法相比,该方法的准确率、召回率、F值都有较大提高,在微博信息分析领域有着较好的应用前景.
推荐文章
微博突发话题检测方法研究
微博
突发话题
滑动窗口
语义相似度
空间向量模型
话题检测与跟踪
基于SOM聚类的微博话题发现
话题发现
词向量模型
文本相似度
短文本
SOM聚类
基于动态窗口的微博突发话题检测方法
微博
突发话题
动态窗口
词对加速度
非负矩阵分解
基于时间窗口包含用户行为的微博突发话题检测方法
突发话题
突发特征
微博
动量模型
时间窗口
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于回归模型与谱聚类的微博突发话题检测方法
来源期刊 计算机工程 学科 工学
关键词 微博 突发话题检测 词频分析 回归模型 谱聚类 大数据
年,卷(期) 2015,(12) 所属期刊栏目 人工智能及识别技术
研究方向 页码范围 176-181
页数 6页 分类号 TP391
字数 6132字 语种 中文
DOI 10.3969/j.issn.1000-3428.2015.12.034
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 彭敏 武汉大学计算机学院 68 440 11.0 19.0
2 朱佳晖 武汉大学计算机学院 3 13 2.0 3.0
3 黄济民 武汉大学计算机学院 6 85 4.0 6.0
4 张泰玮 武汉大学深圳研究院 1 4 1.0 1.0
5 黄佳佳 武汉大学计算机学院 3 62 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (20)
共引文献  (491)
参考文献  (3)
节点文献
引证文献  (4)
同被引文献  (9)
二级引证文献  (11)
1988(1)
  • 参考文献(1)
  • 二级参考文献(0)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(4)
  • 参考文献(0)
  • 二级参考文献(4)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(6)
  • 引证文献(2)
  • 二级引证文献(4)
2019(4)
  • 引证文献(0)
  • 二级引证文献(4)
2020(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
微博
突发话题检测
词频分析
回归模型
谱聚类
大数据
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
论文1v1指导