基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为避免初始聚类中心选取到孤立点容易导致聚类结果陷入局部最优的不足,提出一种基于密度的K-means(聚类算法)初始聚类中心选择方法.该方法首先计算每个数据对象与其它数据对象间的平均相似度,找出平均相似度高于某固定阈值的对象视作核心对象,再从核心对象中选取彼此间最不相似的作为初始聚类中心.通过自构建的新浪微博抓取工具,分别抓取不同类别的数千条数据,经过分词、预处理及权重计算后,用改进的K-means算法对其进行聚类分析,查准/全率较传统的K-means算法要稳定,聚类的平均时间也得到缩短.实验结果表明,改进后的算法在微博聚类中有更高的准确性和稳定性,有利于从大量的微博数据中发现热点舆情.
推荐文章
k-means算法的研究与改进
聚类
划分方法
数据样本
阈值
基于改进磷虾群算法的K-means算法
磷虾群算法
聚类算法
精英引领
最佳聚类数
动态分群
基于MapReduce框架下K-means的改进算法
MapReduce框架
K-means算法
数据挖掘
聚类分析
基于Spark的改进K-means算法的并行实现
聚类算法
简化轮廓系数
形态学相似距离
相似性度量
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于改进K-means算法的微博舆情分析研究
来源期刊 计算机工程与科学 学科 工学
关键词 微博 聚类中心 K-means聚类算法 密度
年,卷(期) 2018,(1) 所属期刊栏目 人工智能与数据挖掘
研究方向 页码范围 155-158
页数 4页 分类号 TP301
字数 3585字 语种 中文
DOI 10.3969/j.issn.1007-130X.2018.01.023
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 谢修娟 东南大学成贤学院计算机工程系 26 72 6.0 7.0
2 李香菊 东南大学成贤学院计算机工程系 26 68 5.0 6.0
3 莫凌飞 东南大学仪器科学与工程学院 12 63 4.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (41)
共引文献  (229)
参考文献  (11)
节点文献
引证文献  (6)
同被引文献  (39)
二级引证文献  (7)
1967(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(4)
  • 参考文献(1)
  • 二级参考文献(3)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(6)
  • 参考文献(1)
  • 二级参考文献(5)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(9)
  • 参考文献(1)
  • 二级参考文献(8)
2010(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(4)
  • 参考文献(1)
  • 二级参考文献(3)
2012(8)
  • 参考文献(1)
  • 二级参考文献(7)
2013(3)
  • 参考文献(2)
  • 二级参考文献(1)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(6)
  • 引证文献(3)
  • 二级引证文献(3)
2020(5)
  • 引证文献(1)
  • 二级引证文献(4)
研究主题发展历程
节点文献
微博
聚类中心
K-means聚类算法
密度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
总被引数(次)
59030
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导