基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
对数据量大的评价文本内容进行分类分析较困难,为解决这一难题,提出面向XGBoost的评价文本智能分类模型,在样本不均衡问题下采用随机欠采样方法进行处理,对文本内容使用jieba分词和停用词进行词向量表示,使用PCA(主成分分析)进行特征降维,使用交叉验证方法寻找XGBoost最优参数.为验证模型的有效性,分别在1647条数据以及9994条数据上进行实验.实验结果表明,XGBoost模型在评价文本分类时精准率、召回率、F1值分别达到了87.62%、87.73%、87.67%.面向XGBoost的评价文本智能分类模型不仅能快速对数量大的评价文本内容进行分类,而且能有效降低人工分类误差.
推荐文章
基于XGBoost算法的电商评论文本情感识别模型
电子商务
用户评论
XGBoost算法
情感识别
基于XGBoost分类算法的热舒适预测模型
热舒适
XGBoost分类算法
公共建筑
SHAP值
面向不良文本信息的中文网页分类方法
信息安全
内容安全
文本分类
贝叶斯理论
面向审计领域的短文本分类技术研究
审计问题分类
审计领域
信息增益
SVM决策树
短文本分类
审计报告
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向XGBoost的课程评价文本智能分类模型
来源期刊 软件导刊 学科
关键词 文本分类 jieba分词 XGBoost模型 随机欠采样 交叉验证
年,卷(期) 2021,(9) 所属期刊栏目 人工智能
研究方向 页码范围 14-17
页数 4页 分类号 TP301
字数 语种 中文
DOI 10.11907/rjdk.202560
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (88)
共引文献  (11)
参考文献  (14)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1967(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(5)
  • 参考文献(0)
  • 二级参考文献(5)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(5)
  • 参考文献(0)
  • 二级参考文献(5)
2012(8)
  • 参考文献(0)
  • 二级参考文献(8)
2013(7)
  • 参考文献(0)
  • 二级参考文献(7)
2014(12)
  • 参考文献(0)
  • 二级参考文献(12)
2015(8)
  • 参考文献(0)
  • 二级参考文献(8)
2016(3)
  • 参考文献(0)
  • 二级参考文献(3)
2017(4)
  • 参考文献(1)
  • 二级参考文献(3)
2018(14)
  • 参考文献(4)
  • 二级参考文献(10)
2019(3)
  • 参考文献(3)
  • 二级参考文献(0)
2020(6)
  • 参考文献(6)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本分类
jieba分词
XGBoost模型
随机欠采样
交叉验证
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件导刊
月刊
1672-7800
42-1671/TP
16开
湖北省武汉市
38-431
2002
chi
出版文献量(篇)
9809
总下载数(次)
57
论文1v1指导