基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
密度峰值聚类(density peak clustering,DPC)是一种简单有效的聚类分析方法.但在实际应用中,对于簇间密度差别大或者簇中存在多密度峰的数据集,DPC很难选择正确的簇中心;同时,DPC中点的分配方法存在多米诺骨牌效应.针对这些问题,提出一种基于K近邻(K-nearest neighbors,KNN)和优化分配策略的密度峰值聚类算法.首先,基于KNN、点的局部密度和边界点确定候选簇中心;定义路径距离以反映候选簇中心之间的相似度,基于路径距离提出密度因子和距离因子来量化候选簇中心作为簇中心的可能性,确定簇中心.然后,为了提升点的分配的准确性,依据共享近邻、高密度最近邻、密度差值和KNN之间距离构建相似度,并给出邻域、相似集和相似域等概念,以协助点的分配;根据相似域和边界点确定初始聚类结果,并基于簇中心获得中间聚类结果.最后,依据中间聚类结果和相似集,从簇中心到簇边界将簇划分为多层,分别设计点的分配策略;对于具体层次中的点,基于相似域和积极域提出积极值以确定点的分配顺序,将点分配给其积极域中占主导地位的簇,获得最终聚类结果.在11个合成数据集和27个真实数据集上进行仿真实验,与最新的基于密度峰值的聚类算法作对比,结果表明:所提算法在纯度、F度量、准确度、兰德系数、调整兰德系数和标准互信息上均表现出良好的聚类性能.
推荐文章
基于加权K近邻的改进密度峰值聚类算法
数据挖掘
加权K近邻
密度峰值
聚类
优化分配策略的密度峰值聚类算法
密度聚类
快速搜索与发现密度峰值聚类(DPC)
分配策略
基于密度峰值优化的谱聚类算法
谱聚类
密度峰值
密度聚类
自适应
Nystr(o)m抽样
基于改进果蝇优化的密度峰值聚类算法
密度峰值聚类
截断距离
果蝇优化算法
Tent混沌
柯西变异
收敛性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于K近邻和优化分配策略的密度峰值聚类算法
来源期刊 软件学报 学科 工学
关键词 密度峰值聚类 K近邻 簇中心 积极值 分配策略
年,卷(期) 2022,(4) 所属期刊栏目 面向开放场景的鲁棒机器学习专刊|SPECIAL ISSUE ON ROBUST MACHINE LEARNING IN THE OPEN-WORLD SCENARIOS
研究方向 页码范围 1390-1411
页数 22页 分类号 TP311
字数 语种 中文
DOI 10.13328/j.cnki.jos.006462
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
密度峰值聚类
K近邻
簇中心
积极值
分配策略
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导