利用QSPR研究方法,结合遗传算法(Genetic Algorithm,GA)和多元线性回归(Multiple Linear Regression,MLR),建立了3635个有机化合物液相膨胀系数的QSPR模型.该模型包含6个描述符,对于训练集R2=0.833%,Q2=0.810%,RMSE和AARD分别是0.043%和1.02%,测试集的统计结果是R2 =0.811,RMSE=0.061%,AARD=1.425%.这个模型对于包含大量有机化合物的数据集来说,是可靠并稳定的,具有较好的预测能力.