基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对大数据环境下聚类算法所处理数据规模越来越大、对算法时效性要求越来越高的问题,提出一种基于分布式计算框架Spark的改进K-means快速聚类算法Spark-KM.首先针对K-means算法因初始聚类点选择不当导致局部最优、迭代次数增加而无法适应大规模数据聚类的问题,通过预抽样和最大最小距离相结合对K-means算法进行改进;然后对原始数据进行矩阵分割,并存储在不同的Spark计算框架的结点当中;最后根据改进的K-means算法,结合分布式矩阵计算和Spark平台进行大数据快速聚类.结果表明,文中算法可以有效减少结点间的数据移动次数,并具有良好的可扩展性.通过该算法在单机环境和集群环境的对比测试,说明该算法适用于大规模数据环境,且算法性能与数据规模成正比,集群环境较单机环境也具有很大的性能提高.
推荐文章
基于改进k-means算法的文本聚类
k-means算法
共现词
词向量
相似性
基于Spark的改进K-means算法的并行实现
聚类算法
简化轮廓系数
形态学相似距离
相似性度量
基于MapReduce框架下的K-means聚类算法的改进
K-means算法
相异度函数
MapReduce模型
文档聚类中k-means算法的一种改进算法
文档聚类
k-means算法
划分聚类算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Spark的改进K-means快速聚类算法
来源期刊 江苏大学学报(自然科学版) 学科 工学
关键词 改进K-means 预抽样 最大最小距离 矩阵分割 矩阵计算
年,卷(期) 2018,(3) 所属期刊栏目
研究方向 页码范围 316-323
页数 8页 分类号 TP391.1
字数 7010字 语种 中文
DOI 10.3969/j.issn.1671-7775.2018.03.012
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 詹永照 江苏大学计算机科学与通信工程学院 189 1744 21.0 31.0
2 徐健锐 江苏大学计算机科学与通信工程学院 8 57 4.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (60)
共引文献  (38)
参考文献  (11)
节点文献
引证文献  (14)
同被引文献  (87)
二级引证文献  (24)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(7)
  • 参考文献(0)
  • 二级参考文献(7)
2012(6)
  • 参考文献(0)
  • 二级参考文献(6)
2013(8)
  • 参考文献(1)
  • 二级参考文献(7)
2014(8)
  • 参考文献(1)
  • 二级参考文献(7)
2015(9)
  • 参考文献(3)
  • 二级参考文献(6)
2016(5)
  • 参考文献(3)
  • 二级参考文献(2)
2017(3)
  • 参考文献(3)
  • 二级参考文献(0)
2018(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(19)
  • 引证文献(8)
  • 二级引证文献(11)
2020(18)
  • 引证文献(5)
  • 二级引证文献(13)
研究主题发展历程
节点文献
改进K-means
预抽样
最大最小距离
矩阵分割
矩阵计算
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
江苏大学学报(自然科学版)
双月刊
1671-7775
32-1668/N
大16开
江苏省镇江市梦溪园巷30号
28-83
1980
chi
出版文献量(篇)
2980
总下载数(次)
2
总被引数(次)
31026
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导