快速搜索和找到密度峰DPC(clustering by fast search and find of density peaks)的聚类是一种新颖的算法,它通过找到密度峰来有效地发现聚类的中心.DPC算法的精度取决于对给定数据集的密度的精确估计以及对截止距离dc(cutoff distance)的选择.dc主要是用于计算每个数据点的密度和识别集群中的边界点,而DPC算法中dc的估计值却主要取决于主观经验值.提出一种基于核密度估计的DPC方法(KDE-DPC)来确定最合适的dc值.该方法通过引用一种新的Solve-the-Equation方法进行窗宽优化,根据不同数据集的概率分布,计算出最适合的dc.标准聚类基准数据集的实验结果证实了所提出的方法优越于DPC算法以及经典的K-means算法、DB-SCAN算法和AP算法.