作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对k-means算法过度依赖初始聚类中心、收敛速度慢等局限性及其在处理海量数据时存在的内存不足问题,提出一种新的针对大数据集的混合聚类算法super-k-means,将改进的基于超网络的高维数据聚类算法与k-means相结合,并经过MapReduce并行化后部署在Hadoop集群上运行.实验表明,该算法不仅在收敛性以及聚类精度两方面得到优化,其加速比和扩展性也有了大幅度的改善.
推荐文章
基于改进人工蜂群算法与MapReduce的大数据聚类算法
数据分析
聚类算法
人工蜂群算法
灰狼优化算法
云计算
分布式计算
基于小波聚类的数据集简化算法研究
数据集
简化
小波变换
聚类
算法
云环境下基于群智能算法的大数据聚类挖掘技术
大数据聚类挖掘
云计算模型分析
聚类分析
聚类算法设计
算法优化
聚类算法改进
大数据中数据挖掘模型的模糊改进聚类算法
增量型模糊聚类
大数据
数据挖掘模型
聚类算法
余弦相似度
隶属度矩阵
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种改进的基于大数据集的混合聚类算法
来源期刊 计算机工程与科学 学科 工学
关键词 k-means 超网络 频繁项集 超图划分 MapReduce
年,卷(期) 2015,(9) 所属期刊栏目 高性能计算
研究方向 页码范围 1621-1626
页数 6页 分类号 TP391
字数 4018字 语种 中文
DOI 10.3969/j.issn.1007-130X.2015.09.003
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王红 30 129 6.0 10.0
2 张晓 山东师范大学信息科学与工程学院 12 55 4.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (53)
共引文献  (835)
参考文献  (6)
节点文献
引证文献  (9)
同被引文献  (39)
二级引证文献  (12)
1974(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(7)
  • 参考文献(0)
  • 二级参考文献(7)
2005(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(12)
  • 参考文献(0)
  • 二级参考文献(12)
2008(10)
  • 参考文献(2)
  • 二级参考文献(8)
2009(6)
  • 参考文献(0)
  • 二级参考文献(6)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(3)
  • 参考文献(1)
  • 二级参考文献(2)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(3)
  • 引证文献(3)
  • 二级引证文献(0)
2018(4)
  • 引证文献(2)
  • 二级引证文献(2)
2019(3)
  • 引证文献(0)
  • 二级引证文献(3)
2020(7)
  • 引证文献(0)
  • 二级引证文献(7)
研究主题发展历程
节点文献
k-means
超网络
频繁项集
超图划分
MapReduce
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
总被引数(次)
59030
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导