原文服务方: 计算技术与自动化       
摘要:
基于密度峰值的聚类算法(DPC)是最近提出的一种高效密度聚类算法.该算法可以对非球形分布的数据聚类,有待调节参数少、聚类速度快等优点,但在计算每个数据对象的密度值和高密度最邻近距离时,需要进行距离度量,其时间复杂度为.在大数据时代,尤其是处理海量高维数据时,该算法的效率会受到很大的影响.为了提高该算法的效率和扩展性,利用Spark在内存计算以及迭代计算上的优势,提出一种高效的基于E2LSH分区的聚类算法ELSDPC(an efficient distributed density peak clustering algorithm based on E2LSH partition with spark).算法利用DPC算法的局部特性,引入局部敏感哈希算法LSH实现将邻近点集划分到一个区域.通过实验分析表明:该算法可在满足较高准确率的同时有效提高聚类算法的扩展性和时间效率.
推荐文章
一种基于密度的分布式聚类改进算法
聚类
分布式
数据挖掘
代表点
一种分布式的K-means聚类算法
K-means聚类算法
分布式环境
大数据集
复杂度
一种基于代表点的分布式数据流聚类算法
分布式数据流
数据挖掘
聚类
聚类演化
代表点
一种基于多主体技术的分布式图像聚类算法
多主体
图像聚类算法
多结构元素
邻域平均算子
形态学运算
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于密度峰值的高效分布式聚类算法
来源期刊 计算技术与自动化 学科
关键词 聚类 密度峰值 大数据 局部敏感哈希 Spark
年,卷(期) 2019,(2) 所属期刊栏目 算法分析与研究
研究方向 页码范围 64-71
页数 8页 分类号 TP311.1
字数 语种 中文
DOI 10.16339/j.cnki.jsjsyzdh.201902012
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐蔚鸿 长沙理工大学计算机与通信工程学院 85 647 14.0 21.0
5 何仝 长沙理工大学计算机与通信工程学院 1 1 1.0 1.0
9 马红华 长沙理工大学综合交通运输大数据智能处理湖南省重点实验室 1 1 1.0 1.0
10 曾水玲 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (10)
参考文献  (3)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(3)
  • 参考文献(1)
  • 二级参考文献(2)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
聚类
密度峰值
大数据
局部敏感哈希
Spark
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算技术与自动化
季刊
1003-6199
43-1138/TP
16开
1982-01-01
chi
出版文献量(篇)
2979
总下载数(次)
0
论文1v1指导