随着互联网的迅速发展,团购作为新兴的电子商务盈利模式,已成为整个O2O(Online To Offline)市场不可或缺的一部分,对商家和消费者都有一定的引导和借鉴作用,因此运用大数据的方法对团购评论的研究也具有更加现实的意义.本文运用R语言从团购网页上抓取了兰州市火锅店的评论数据,建立语料库进而实现对评论的筛选,采用朴素贝叶斯分类算法建模,从大量的评论数据中训练垃圾评论的分类器,通过对已有模型进行改进,使之更加适用于网购评论的分类,最终实现对团购评论的最大化利用.研究结果表明:通过朴素贝叶斯算法模型训练出的分类器最终对有效评论的识别率达到99.4%,对垃圾评论的识别率达到54.6%,该分类器能准确识别有效评论,对于垃圾评论的识别率有待提高,但仍具有一定的参考价值.