在特征选择过程中,传统特征选择方法可能会因数据集分类不平衡而受到影响,论文提出一种基于不平衡数据类分布学习的特征选择方法.首先,该方法的损失函数由累加相对熵变形为连乘相对熵的形式从而将不平衡数据评价引入至损失函数中.然后,对新的损失函数进行变形及梯度求导得出损失函数下降的梯度方向,通过变步长梯度下降法使得损失函数收敛.最后,通过对学习到的类分布进行阈值控制从而筛选特征以达到特征选择的目的.论文采用了逻辑回归、随机森林、支持向量机和梯度提升决策树四种分类器,FSLDL(Feature Selection Method by Label Distribution Learning Based on Imbalanced Data)、PCA、SVM-RFE和F classify四种特征选择方法,SMOTENN、NearMiss和ADASYN三种不平衡数据采样方法在NASA故障数据集的KC1数据集上做了对比分析,结果表明论文提出的FSLDL在只进行特征选择的情况下对不平衡数据分类效果优于其他特征选择方法,在与不平衡数据采样方法结合时效果也有提升.