基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了解决传统K-Medoids聚类算法在处理海量数据信息时所面临的内存容量和CPU处理速度的瓶颈问题,在深入研究K-Medoids算法的基础之上,提出了基于MapReduce编程模型的K-Medoids并行化算法思想.Map函数部分的主要任务是计算每个数据对象到簇类中心点的距离并(重新)分配其所属的聚类簇;Reduce函数部分的主要任务是根据Map部分得到的中间结果,计算出新簇类的中心点,然后作为中心点集给下一次MapReduce过程使用.实验结果表明:运行在Hadoop集群上的基于MapReduce的K-Medoids并行化算法具有较好的聚类结果和可扩展性,对于较大的数据集,该算法得到的加速比更接近于线性.
推荐文章
基于多核平台并行K-Medoids算法研究
多核
K-Medoids算法
并行算法
OpenMP
云环境下的高效K-Medoids并行算法
云环境
K-Medoids聚类
Canopy算法
最大最小原则
MapReduce
一种高效的K-medoids聚类算法
聚类
K-medoids算法
中心微调
增量候选
一种基于CF树的k-medoids聚类算法
聚类
k-中心点
CF树
微簇
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于MapReduce的K-Medoids并行算法
来源期刊 计算机应用 学科 工学
关键词 K-Medoids 云计算 MapReduee 并行计算 Hadoop
年,卷(期) 2013,(4) 所属期刊栏目 先进计算
研究方向 页码范围 1023-1025,1035
页数 4页 分类号 TP18
字数 3538字 语种 中文
DOI 10.3724/SP.J.1087.2013.01023
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张雪萍 河南工业大学信息科学与工程学院 33 383 11.0 19.0
2 龚康莉 河南工业大学信息科学与工程学院 2 61 2.0 2.0
3 赵广才 河南工业大学信息科学与工程学院 2 81 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (16)
共引文献  (755)
参考文献  (7)
节点文献
引证文献  (58)
同被引文献  (182)
二级引证文献  (212)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(1)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(6)
  • 参考文献(2)
  • 二级参考文献(4)
2010(5)
  • 参考文献(1)
  • 二级参考文献(4)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(16)
  • 引证文献(15)
  • 二级引证文献(1)
2015(22)
  • 引证文献(11)
  • 二级引证文献(11)
2016(23)
  • 引证文献(8)
  • 二级引证文献(15)
2017(48)
  • 引证文献(11)
  • 二级引证文献(37)
2018(57)
  • 引证文献(6)
  • 二级引证文献(51)
2019(69)
  • 引证文献(5)
  • 二级引证文献(64)
2020(35)
  • 引证文献(2)
  • 二级引证文献(33)
研究主题发展历程
节点文献
K-Medoids
云计算
MapReduee
并行计算
Hadoop
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导