基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
聚类热度时间序列是揭示和建模网络热点话题形成与发展的重要过程.Leskovec等人在2010年提出面向话题时间序列的K_SC聚类算法,其精确度较高且能较好地刻画话题内在发展趋势特征.但K_SC算法具有对初始类矩阵中心高度敏感、高时间复杂度等特性,使其难以在实际高维大数据集上应用.文中结合小波变换技术,提出一个新的迭代式聚类算法WKSC,主要提出两个创新:(1)用Haar小波变换将原始时间序列进行压缩,降低原始时间序列的维度,从而降低了算法的时间复杂度;(2)在Haar反小波变换中,将低维聚类返回得到的矩阵中心作为高维聚类的初始矩阵中心,在迭代聚类过程中优化了对初始矩阵中心高敏感性的问题,提高了聚类的效果.文中分别采用国内外3个数据集作为测试样本,进行了大量的实验.实验结果表明WKSC算法能显著降低聚类的时间复杂度,同时改进聚类效果.WKSC算法可很好的应用于大量高维热点话题的模式分析.
推荐文章
基于混合聚类的微博热点话题发现方法
聚类算法
向量空间模型
话题聚类
热点话题
网络舆情热点话题检测聚类算法研究
数据聚类
聚类算法
网络舆情
热点话题检测
流量内容词语相关度的网络热点话题提取
网络热点话题
流量内容
网络舆情分析
基于速度增长的微博热点话题发现
增长斜率
增长速度
时间二元组序列
热点发现
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向热点话题时间序列的有效聚类算法研究
来源期刊 计算机学报 学科 工学
关键词 聚类 时间序列 热点话题 小波
年,卷(期) 2012,(11) 所属期刊栏目 研究论文
研究方向 页码范围 2337-2347
页数 分类号 TP391
字数 6751字 语种 中文
DOI 10.3724/SP.J.1016.2012.02337
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 乐嘉锦 东华大学计算机科学与技术学院 131 1480 20.0 32.0
2 段大高 北京工商大学计算机与信息工程学院 31 326 9.0 17.0
3 韩忠明 北京工商大学计算机与信息工程学院 51 631 14.0 23.0
4 孙践知 北京工商大学计算机与信息工程学院 24 173 7.0 12.0
5 陈妮 北京工商大学计算机与信息工程学院 2 79 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (17)
共引文献  (111)
参考文献  (9)
节点文献
引证文献  (55)
同被引文献  (137)
二级引证文献  (164)
1970(1)
  • 参考文献(0)
  • 二级参考文献(1)
1974(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1980(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(4)
  • 参考文献(0)
  • 二级参考文献(4)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(1)
  • 二级参考文献(1)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(2)
  • 参考文献(2)
  • 二级参考文献(0)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(4)
  • 引证文献(4)
  • 二级引证文献(0)
2014(4)
  • 引证文献(4)
  • 二级引证文献(0)
2015(16)
  • 引证文献(11)
  • 二级引证文献(5)
2016(20)
  • 引证文献(11)
  • 二级引证文献(9)
2017(33)
  • 引证文献(10)
  • 二级引证文献(23)
2018(55)
  • 引证文献(11)
  • 二级引证文献(44)
2019(64)
  • 引证文献(3)
  • 二级引证文献(61)
2020(23)
  • 引证文献(1)
  • 二级引证文献(22)
研究主题发展历程
节点文献
聚类
时间序列
热点话题
小波
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导