K‐均值聚类算法因具有实现简单、快速有效、适合处理大数据集等优点而被广泛应用。但是由于初始聚类中心是随机选择的,K‐均值聚类的结果对初始中心值具有很大的依赖性。另一方面,聚类的类数 K 也对聚类结果具有重要影响,一般情况下 K 是未知的,需要相关的专业知识对 K 进行预测,如果不能事先确定合适的 K 值,聚类的结果也会很不理想。本文提出一种改进的 K‐均值算法,避开了初始中心点的随机选择,只需计算数据集合中相距最远的两个点将其设为初始中心,同时不需要预先猜测聚类的数目,大大减小了用户的使用难度,聚类效果也显著提高。论文将改进的 K‐均值算法应用到自然雷电脉冲的分类中,并与传统 K‐均值算法的分类结果进行了比较。