谱聚类是利用样本数据集的相似性矩阵中特征向量的性质对样本数据集进行聚类。而随着数据规模的增加,谱聚类算法所耗时间会因为大规模的特征分解而明显增大。采用抽样方法可以有效降低算法所耗时间,但是简单随机抽样子集之间关联性太弱,通常无法准确反映数据集的分布特征。基于此,设计了一种新的抽样策略,利用该方法进行多次抽样,生成多个既具有关联性又具有差异性的数据子集。在每个数据子集上分别利用 NJ W 算法(由 Ng A Y、Jordom M I和 Weiss Y提出)进行谱聚类,并根据最近邻原则将聚类结果映射到全体数据集,生成若干基聚类,最后,将聚类结果集成,得到最终的聚类划分。实验证明,该方法与传统 NJ W算法以及简单抽样集成算法相比,算法的效率及有效性有了一定的提高。