目的 利用数据挖掘技术分析脑白质疏松症相关因素.方法 回顾性地收集2015年4月-2017年2月中南医院神经内科符合标准的1197例住院患者临床资料,利用数据挖掘技术4种预测模型和卡方检验基础上的特征选择方法分析脑白质疏松症相关因素.结果 4种数据挖掘模型中,逻辑回归模型预测性能最佳[特征数为9,受试者工作特征曲线下面积(area under the curve,AUC)=0.825±0.012].特征选择方法选出9种与脑白质疏松症相关的因素.利用决策树模型(特征数为4,AUC=0.788±0.017)得到该决策树的可视化结果图.结论 数据挖掘方法选出的因素中与脑白质疏松呈正相关的因素有年龄、高血压病史、颅内动脉狭窄、贫血、2型糖尿病、肌酐、红细胞分布宽度;呈负相关的因素有红细胞计数、血红蛋白浓度.