原文服务方: 湖南大学学报(自然科学版)       
摘要:
为了快速挖掘大规模空间数据的聚集特性,在 cluster_dp 密度聚类算法基础上,提出了一种基于弹性分布数据集的并行密度聚类方法 PClusterdp.首先,设计一种能平衡工作负载弹性分布数据集分区方法,根据数据在空间的分布情况,自动划分网格并分配数据,使得网格内数据量相对均衡,达到平衡运算节点负载的目的;接着,提出一种适用于并行计算的局部密度定义,并改进聚类中心的计算方式,解决了原始算法需要通过绘制决策图判断聚类中心对象的缺陷;最后,通过网格内及网格间聚簇合并等优化策略,实现了大规模空间数据的快速聚类处理.实验结果表明,借助 Spark 数据处理平台编程实现算法,本方法可以有效实现大规模空间数据的快速聚类,与传统的密度聚类方法相比具有较高的精确度与更好的系统处理性能.
推荐文章
高流量负荷下基于支持向量机的空间数据聚类方法
空间数据聚类
支持向量机
空间分布规律
HGHD:一种基于超图的高维空间数据聚类算法
超图模式
高维空间数据
数据聚类
一种基于质量估算的空间数据流聚类算法研究
空间数据挖掘
空间数据流
数据流聚类
质量估算
空间划分
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于弹性分布数据集的海量空间数据密度聚类?
来源期刊 湖南大学学报(自然科学版) 学科
关键词 空间数据 聚类算法 弹性分布式数据集 Spark
年,卷(期) 2015,(8) 所属期刊栏目 【电气与信息工程】
研究方向 页码范围 116-124
页数 9页 分类号 TP301.6
字数 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 蒋新华 中南大学信息科学与工程学院 78 573 11.0 20.0
5 廖律超 中南大学信息科学与工程学院 17 126 6.0 10.0
9 李璐明 中南大学信息科学与工程学院 2 19 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (12)
节点文献
引证文献  (8)
同被引文献  (8)
二级引证文献  (16)
1976(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(2)
  • 参考文献(2)
  • 二级参考文献(0)
2008(2)
  • 参考文献(2)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(4)
  • 参考文献(4)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(8)
  • 引证文献(5)
  • 二级引证文献(3)
2018(6)
  • 引证文献(1)
  • 二级引证文献(5)
2019(7)
  • 引证文献(1)
  • 二级引证文献(6)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
空间数据
聚类算法
弹性分布式数据集
Spark
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
湖南大学学报(自然科学版)
月刊
1674-2974
43-1061/N
16开
1956-01-01
chi
出版文献量(篇)
4993
总下载数(次)
0
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导