目的:利用机器学习算法开发中国人群的阻塞性冠心病验前概率模型。方法:纳入冠状动脉斑块早期识别与风险预警的临床注册研究(Chinese regiStry in early deTection and Risk strAtificaTion of coronary plaques,C-Strat)中疑似为冠心病而接受冠状动脉CT血管造影(CCTA)检查的29 455例就诊者,采集人口统计学和临床信息作为预测变量。数据按7∶3的比例随机拆分为训练集和测试集,以CCTA诊断冠状动脉狭窄大于50%作为阳性结局,在训练集中运用极端梯度增强机(eXtreme Gradient Boosting,XGBoost)算法,使用十折交叉验证和贝叶斯优化进行参数调优,得到机器学习模型CARDIACS(pretest probability model from Chinese registry in eARly Detection and rIsk stratificAtion of Coronary plaques Study);使用logistic回归得到模型LOGISTIC。在测试集中验证比较CARDIACS、LOGISTIC和指南推荐的模型UDFM(Updated Diamond-Forrester Model)、DFCASS(Diamond-Forrester and CASS)。结果:29 455例就诊者年龄(57.0±9.7)岁,女性占44.8%,阻塞性冠心病的患病率为19.1%(5 622/29 455)。在CARDIACS模型中,就诊原因、年龄和体重指数是最重要的预测变量。在独立的测试集中,CARDIACS的曲线下面积(AUC)为0.72(95%
CI 0.70~0.73),优于LOGISTIC(AUC 0.69,95%
CI 0.68~0.71,
P=0.015)、UDFM(AUC 0.64,95%
CI 0.62~0.65,
P<0.001)和DFCASS(AUC 0.66,95%
CI 0.64~0.67,
P<0.001)。
结论:基于中国人群开发的全新的验前概率模型CARDIACS预测中国人群阻塞性冠心病的能力明显优于传统的模型,有望辅助稳定性胸痛临床决策。