基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对传统 K -Me doids算法对初始聚类中心敏感、收敛速度慢,以及在大数据环境下所面临的内存容量和CPU处理速度的瓶颈问题,从改进初始中心选择方案和中心替换策略入手,利用Hadoop分布式计算平台结合基于Top K 的并行随机采样策略,实现了一种高效稳定的 K -Medoids并行算法,并且通过调整Hadoop平台,实现算法的进一步优化。实验证明,改进的K-Medoids算法不仅有良好的加速比,其收敛性和聚类精度均得到了改善。
推荐文章
一种基于Hadoop架构的并行挖掘算法研究
挖掘算法
Hadoop架构
SPRINT
并行化
决策树
MapReduce
基于Hadoop的Canopy-K-means并行算法的学生成绩与毕业流向关系分析
Hadoop
Canopy-K-means
最小最大原则
MapReduce
教务
毕业流向
一种三维结构网格并行算法
三维结构网格
MPICH2
并行计算
数据通信
一种面向大型矩阵运算的分布并行算法
直接变换法
分布并行算法
矩阵分解
矩阵存储
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于Hadoop的高效K -Me doids并行算法
来源期刊 计算机工程与应用 学科 工学
关键词 K -Me doids 分布式计算 Hadoop 并行采样
年,卷(期) 2015,(16) 所属期刊栏目 理论研究、研发设计
研究方向 页码范围 47-54
页数 8页 分类号 TP301
字数 6988字 语种 中文
DOI 10.3778/j.issn.1002-8331.1406-0183
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王永贵 辽宁工程技术大学软件工程学院 47 293 10.0 15.0
2 戴伟 辽宁工程技术大学软件工程学院 2 17 2.0 2.0
3 武超 辽宁工程技术大学软件工程学院 3 17 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (79)
共引文献  (811)
参考文献  (16)
节点文献
引证文献  (7)
同被引文献  (31)
二级引证文献  (26)
1959(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(4)
  • 参考文献(0)
  • 二级参考文献(4)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(6)
  • 参考文献(1)
  • 二级参考文献(5)
2007(5)
  • 参考文献(1)
  • 二级参考文献(4)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(15)
  • 参考文献(2)
  • 二级参考文献(13)
2010(17)
  • 参考文献(1)
  • 二级参考文献(16)
2011(10)
  • 参考文献(1)
  • 二级参考文献(9)
2012(13)
  • 参考文献(4)
  • 二级参考文献(9)
2013(6)
  • 参考文献(6)
  • 二级参考文献(0)
2015(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(5)
  • 引证文献(3)
  • 二级引证文献(2)
2018(16)
  • 引证文献(1)
  • 二级引证文献(15)
2019(8)
  • 引证文献(0)
  • 二级引证文献(8)
2020(3)
  • 引证文献(2)
  • 二级引证文献(1)
研究主题发展历程
节点文献
K -Me doids
分布式计算
Hadoop
并行采样
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导