在电影市场中,电影成片的类型和风格与用户的观影偏好互相影响,并共同作用于电影市场的发展方向.本文针对国内电影市场中用户的电影数据进行挖掘,对用户的观影偏好进行分析,并构建电影用户画像,深层次挖掘电影市场中的用户需求.首先,从电影平台采集大量的用户电影数据,然后根据采集数据构造一个电影用户画像标签体系,最后使用XG-Boost对用户的观影活跃度进行分析预测,使用NLP(Natural Language Processing)、机器学习分类预测等方法对用户的中文影评长文本进行属性级别的细粒度情感分析.