基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对最大最小值原则的Kmeans聚类算法运行在Hadoop平台时需要多次遍历所有数据的问题,提出了一种改进的初始聚类中心的选择算法称为M+Kmeans算法。该算法只需要遍历一次全局数据极大的缩减了算法并行运算时消耗的时间。多组实验测试结果显示,设计的M+Kmeans算法适合运行在大规模集群Hadoop平台上,并且加速比和扩展率较原始算法有明显提高。
推荐文章
基于最优K均值聚类算法的负荷大数据任务均衡调度研究
最优 K 均值
大数据聚类
电力负荷
跨源调度
关联特征提取
基于优化粒子群算法的云环境大数据聚类算法
大数据聚类
云环境
粒子群优化
空间分割
模糊聚类
仿真测试
大数据环境下基于狼群优化的聚类算法分析与研究
大数据
狼群优化算法
数据聚类
数据位置更新
狼群模拟训练
数据训练
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于大数据平台hadoop的聚类算法K值优化研究
来源期刊 太原科技大学学报 学科 工学
关键词 聚类 大数据 Hadoop Kmeans
年,卷(期) 2015,(2) 所属期刊栏目 计算机科学与信息工程
研究方向 页码范围 92-96
页数 5页 分类号 TP301.6
字数 3760字 语种 中文
DOI 10.3969/j.issn.1673-2057.2015.02.003
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 董增寿 太原科技大学电子信息工程学院 69 116 5.0 9.0
2 武霞 太原科技大学电子信息工程学院 2 0 0.0 0.0
3 孟晓燕 太原科技大学电子信息工程学院 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
聚类
大数据
Hadoop
Kmeans
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
太原科技大学学报
双月刊
1673-2057
14-1330/N
大16开
山西省太原市万柏林区窊流路66号
22-34
1980
chi
出版文献量(篇)
2179
总下载数(次)
6
总被引数(次)
8489
相关基金
山西省自然科学基金
英文译名:Shanxi Natural Science Foundation
官方网址:http://sxnsfc.sxinfo.gov.cn/sxnsf/index.aspx
项目类型:
学科类型:
论文1v1指导