基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出一种MapReduce框架下基于抽样的分布式K-Means聚类算法,解决海量数据环境下并行执行K-Means算法时,时间开销较大的问题.该算法使用抽样方法,在保证数据分布不变的前提下,对数据集的规模进行约减,并在MapReduce框架下对聚类算法进行优化.实验结果表明,该算法在保持良好聚类效果的同时,能有效缩短聚类时间,对大规模数据集具有较高的执行效率和较好的可扩展性.
推荐文章
基于MapReduce框架下K-means的改进算法
MapReduce框架
K-means算法
数据挖掘
聚类分析
一种分布式的K-means聚类算法
K-means聚类算法
分布式环境
大数据集
复杂度
基于MapReduce的K-means聚类算法的优化
K均值算法
抽样
Canopy算法
最大最小距离法
基于数据抽样的自动k-means聚类算法
k-means算法
信息熵
最优样本抽取
有效性指标
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 MapReduce框架下基于抽样的分布式K-Means聚类算法
来源期刊 吉林大学学报(理学版) 学科 工学
关键词 抽样 MapReduce 分布式计算 K-Means聚类算法
年,卷(期) 2017,(1) 所属期刊栏目 计算机科学
研究方向 页码范围 109-115
页数 7页 分类号 TP391
字数 4794字 语种 中文
DOI 10.13413/j.cnki.jdxblxb.2017.01.19
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 曲朝阳 东北电力大学信息工程学院 104 1025 15.0 26.0
2 杨杰明 东北电力大学信息工程学院 36 145 7.0 10.0
3 吴启龙 东北电力大学信息工程学院 2 8 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (32)
共引文献  (109)
参考文献  (13)
节点文献
引证文献  (7)
同被引文献  (20)
二级引证文献  (23)
1967(1)
  • 参考文献(0)
  • 二级参考文献(1)
1979(1)
  • 参考文献(1)
  • 二级参考文献(0)
1980(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(5)
  • 参考文献(1)
  • 二级参考文献(4)
2006(5)
  • 参考文献(1)
  • 二级参考文献(4)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(6)
  • 参考文献(3)
  • 二级参考文献(3)
2012(3)
  • 参考文献(1)
  • 二级参考文献(2)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(4)
  • 参考文献(3)
  • 二级参考文献(1)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(3)
  • 引证文献(2)
  • 二级引证文献(1)
2019(16)
  • 引证文献(3)
  • 二级引证文献(13)
2020(11)
  • 引证文献(2)
  • 二级引证文献(9)
研究主题发展历程
节点文献
抽样
MapReduce
分布式计算
K-Means聚类算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
吉林大学学报(理学版)
双月刊
1671-5489
22-1340/O
大16开
长春市南湖大路5372号
12-19
1955
chi
出版文献量(篇)
4812
总下载数(次)
6
总被引数(次)
24333
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导