催化裂化装置是一个高度非线性和相互强关联的多变量系统,基于数据挖掘技术的分析方法是优化该工艺过程的一类有力工具.笔者利用某石油化工企业集散控制系统(Distributed control system,DCS)和实验室信息管理系统(Laboratory information management system,LIMS)的工业生产实时数据,分别从指标与汽油收率的正负相关性、工业经验以及模型重要性筛选等方面选取了182个关键影响参数,利用梯度提升决策树(GBDT)算法构建催化裂化汽油收率的预测模型,预测相应的汽油收率.基于GBDT集成学习框架构建了P-GBDT模型,引入了特征扰动和特征权重,增大经验可控参数的权重,解决了普通GBDT模型对特征缺乏偏好、经验可控参数特征的权重较小的问题.结果 显示,由P-GBDT算法构建的汽油收率预测模型预测结果的准确率、R2、均方根误差等指标相比由GBDT算法构建的基准模型的预测结果明显更好,对真实收率的拟合效果更为接近,对优化改进实际可控装置操作条件具有更好的指导意义.