基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
对数据量大的评价文本内容进行分类分析较困难,为解决这一难题,提出面向XGBoost的评价文本智能分类模型,在样本不均衡问题下采用随机欠采样方法进行处理,对文本内容使用jieba分词和停用词进行词向量表示,使用PCA(主成分分析)进行特征降维,使用交叉验证方法寻找XGBoost最优参数.为验证模型的有效性,分别在1647条数据以及9994条数据上进行实验.实验结果表明,XGBoost模型在评价文本分类时精准率、召回率、F1值分别达到了87.62%、87.73%、87.67%.面向XGBoost的评价文本智能分类模型不仅能快速对数量大的评价文本内容进行分类,而且能有效降低人工分类误差.
推荐文章
基于Spark框架XGBoost的林业文本并行分类方法研究
林业文本
文本分类
大数据分析
Spark
XGBoost
基于XGBoost算法的电商评论文本情感识别模型
电子商务
用户评论
XGBoost算法
情感识别
基于语义相似度与XGBoost算法的英语作文智能评价框架研究
英语作文
智能评分
语义表示
相似度
XGBoost
基于XGBoost模型的心律失常分类算法研究
心电信号
XGBoost
心律失常
特征提取
机器学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向XGBoost的课程评价文本智能分类模型
来源期刊 软件导刊 学科
关键词 文本分类 jieba分词 XGBoost模型 随机欠采样 交叉验证
年,卷(期) 2021,(9) 所属期刊栏目 人工智能
研究方向 页码范围 14-17
页数 4页 分类号 TP301
字数 语种 中文
DOI 10.11907/rjdk.202560
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (88)
共引文献  (11)
参考文献  (14)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1967(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(5)
  • 参考文献(0)
  • 二级参考文献(5)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(5)
  • 参考文献(0)
  • 二级参考文献(5)
2012(8)
  • 参考文献(0)
  • 二级参考文献(8)
2013(7)
  • 参考文献(0)
  • 二级参考文献(7)
2014(12)
  • 参考文献(0)
  • 二级参考文献(12)
2015(8)
  • 参考文献(0)
  • 二级参考文献(8)
2016(3)
  • 参考文献(0)
  • 二级参考文献(3)
2017(4)
  • 参考文献(1)
  • 二级参考文献(3)
2018(14)
  • 参考文献(4)
  • 二级参考文献(10)
2019(3)
  • 参考文献(3)
  • 二级参考文献(0)
2020(6)
  • 参考文献(6)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本分类
jieba分词
XGBoost模型
随机欠采样
交叉验证
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件导刊
月刊
1672-7800
42-1671/TP
16开
湖北省武汉市
38-431
2002
chi
出版文献量(篇)
9809
总下载数(次)
57
总被引数(次)
30383
论文1v1指导