基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为解决传统聚类算法K-means在处理海量数据聚类时对初始中心点的选取十分的依赖,容易得到部分最优而非全局最优的聚类后果,提出了一种基于Spark改进的聚类优化DMCK-means算法.DMCK-means算法首先应用密度法排除孤立点和噪声点使初始聚类中心选取趋于最优化;采用Canopy算法和最大最小距离原则,粗略聚类降低运算规模同时避免中心选取的盲目性.实验结果表明:该改进算法不仅降低了对初始聚类中心点选取的依赖,而且降低了聚类的时间,具有良好的扩展性和可行性,在处理大规模海量数据时能展示出较大的优势.
推荐文章
基于Spark的并行K-means算法研究
Spark
K-means
PSO
迭代计算
基于Spark的改进K-means算法的并行实现
聚类算法
简化轮廓系数
形态学相似距离
相似性度量
个性化服务中的并行K-Means聚类算法
个性化服务
并行
聚类算法
自适应布谷鸟搜索的并行K-means聚类算法
聚类
K-均值算法
布谷乌搜索算法
Hadoop
MapReduce
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Spark的K-means聚类的并行实现与优化
来源期刊 福建电脑 学科
关键词 密度法 最大最小距离原则 Canopy算法 K-means算法 Spark
年,卷(期) 2017,(11) 所属期刊栏目 基金项目论文
研究方向 页码范围 1-4
页数 4页 分类号
字数 4609字 语种 中文
DOI 10.16707/j.cnki.fjpc.2017.11.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王兴芬 北京信息科技大学信息管理学院 42 221 8.0 13.0
2 马洋春 北京信息科技大学计算机学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (96)
共引文献  (80)
参考文献  (11)
节点文献
引证文献  (1)
同被引文献  (14)
二级引证文献  (2)
1967(2)
  • 参考文献(0)
  • 二级参考文献(2)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(4)
  • 参考文献(0)
  • 二级参考文献(4)
2004(6)
  • 参考文献(0)
  • 二级参考文献(6)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(6)
  • 参考文献(0)
  • 二级参考文献(6)
2008(11)
  • 参考文献(0)
  • 二级参考文献(11)
2009(9)
  • 参考文献(0)
  • 二级参考文献(9)
2010(5)
  • 参考文献(0)
  • 二级参考文献(5)
2011(7)
  • 参考文献(0)
  • 二级参考文献(7)
2012(8)
  • 参考文献(0)
  • 二级参考文献(8)
2013(6)
  • 参考文献(2)
  • 二级参考文献(4)
2014(12)
  • 参考文献(1)
  • 二级参考文献(11)
2015(9)
  • 参考文献(3)
  • 二级参考文献(6)
2016(6)
  • 参考文献(4)
  • 二级参考文献(2)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
密度法
最大最小距离原则
Canopy算法
K-means算法
Spark
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
福建电脑
月刊
1673-2782
35-1115/TP
大16开
福州市华林邮局29号信箱
1985
chi
出版文献量(篇)
21147
总下载数(次)
86
总被引数(次)
44699
论文1v1指导