大数据挖掘技术已经渗透到当今众多行业和业务职能领域,使得企业的营销重心以产品为中心转向以客户为中心.增量客户争夺与存量客户维系对各大电信运营商而言至关重要,客户流失率一直是各电信运营商所关注的核心业务指标.本文系统地分析了大数据挖掘技术在电信客户流失预测中应用现状与客户流失预测方案的建立过程,方案中使用决策树约简与K-Means++聚类的方法改进了传统随机森林算法,得到一个高精度、低相似的TMRF(Trees Merge Random Forest)预测算法.通过真实数据进行预测方案的验证发现:TMRF算法较C4.5与传统随机森林在精确率、召回率、F-score值及ROC曲线等指标上均有较大提升,具有较高的应用价值.