国内的P2P网贷行业经监管整治后呈现出越来越重视线上风控的趋势,机器学习等技术被广泛应用于构建信用评价体系.而违约的和正常还款的样本类别不平衡是建模的一大难点,有针对性地构建了一种比例平衡的随机森林模型(Ratio-balanced Random Forest).模型对多数类进行多次欠采样,和少数类合并生成多个比例均衡的样本子集,再融合随机子空间添加属性扰动,最后利用随机森林构建集成的分类器模型.在拍拍贷真实借贷数据集上与机器学习单模型、集成模型和平衡的集成模型三类方法做对比实验,结果验证了该模型的有效性,并指出平衡的集成模型方法在解决不平衡分类问题上的优越性.