基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对传统Canopy-Kmeans算法中的随机性Canopy选取的问题,提出了一种BCKmeans并行优化算法.采用"二分法"全局确定初始CanopyCenter(Canopy中心点),避免了Canopy选取的局部最优问题;采用"初始动态迭代的最值原则"对CanopyCenter的选取进行优化,动态迭代改变区域半径T1的值;在Map-Reduce并行计算框架上扩展算法的并行性,充分利用集群的计算和存储能力,从而适应海量分布式存储数据的应用环境.以UCI数据库中的3D Road Network(North Jutland,Denmark)数据集作为聚类应用的背景,对改进后的算法进行了实验分析.实验结果表明:该算法能进一步改善聚类质量,在扩展率以及分类准确率上与随机选取Canopy策略相比都有明显提高.
推荐文章
基于Map-Reduce并行构架和AE的大数据指纹监控识别算法
指纹识别
自动编码器
受限玻尔兹曼机
智能监控
Map-Reduce
基于改进蛙跳策略的Map-Reduce作业调度算法
蛙跳策略
Map-Reduce
作业调度
多样性
逆转变异
基于改进蛙跳策略的Map-Reduce作业调度算法
蛙跳策略
Map-Reduce
作业调度
多样性
逆转变异
基于云计算的并行K-means聚类算法研究
云计算技术
Hadoop
MapReduce
K-means算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Map-Reduce模型的BCkmeans并行聚类算法
来源期刊 电子技术 学科
关键词 Canopy-Kmeans算法 并行优化 Map-Reduce 聚类 分布式存储
年,卷(期) 2016,(5) 所属期刊栏目 电子技术研发
研究方向 页码范围 26-30,25
页数 6页 分类号
字数 4276字 语种 中文
DOI 10.3969/j.issn.1000-0755.2016.05.008
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 肖雪平 1 2 1.0 1.0
2 倪建成 1 2 1.0 1.0
3 曹博 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (30)
共引文献  (201)
参考文献  (8)
节点文献
引证文献  (2)
同被引文献  (11)
二级引证文献  (0)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(6)
  • 参考文献(0)
  • 二级参考文献(6)
2006(4)
  • 参考文献(1)
  • 二级参考文献(3)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(4)
  • 参考文献(1)
  • 二级参考文献(3)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Canopy-Kmeans算法
并行优化
Map-Reduce
聚类
分布式存储
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子技术
月刊
1000-0755
31-1323/TN
大16开
上海市长宁区泉口路274号
4-141
1963
chi
出版文献量(篇)
5480
总下载数(次)
19
总被引数(次)
22245
论文1v1指导