基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对多种数据预处理方式及其组合如何提升模型拟合效果这一问题,基于UCI Machine Learning Repository典型数据集,分别利用20种变量处理方式和4种变量选择方法对数据预处理,并对模型拟合效果对比分析,分别考查了多种数据预处理方式及其组合对常见分类模型和回归模型的影响.通过对实验结果的分析讨论,提出一种启发式算法,根据数据特征、模型特点以及研究问题种类等信息推荐数据预处理方法.在更广泛的数据集上的实验结果表明,该算法所推荐的数据预处理方法可以一定程度上提升模型拟合效果,节省手工选取数据预处理方法的开销.
推荐文章
基于粗糙集理论的数据预处理
粗糙集
数据预处理
分辨矩阵
约简求核
数据预处理的数据缩减方法的研究
数据预处理
数据缩减
离散化
Web日志数据挖掘的数据预处理方法研究
Web用户访问日志数据挖掘
数据预处理方法
智能建模方法中的数据预处理
建模
数据预处理
PCA
神经网络
燃烧系统
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于典型数据集的数据预处理方法对比分析
来源期刊 沈阳工业大学学报 学科 工学
关键词 数据预处理 正态化 归一化 哑变量 方差分析 卡方检验 互信息 Copula熵
年,卷(期) 2022,(2) 所属期刊栏目 信息科学与工程|Information Science & Engineering
研究方向 页码范围 185-192
页数 8页 分类号 TP306
字数 语种 中文
DOI 10.7688/j.issn.1000-1646.2022.02.11
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据预处理
正态化
归一化
哑变量
方差分析
卡方检验
互信息
Copula熵
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
沈阳工业大学学报
双月刊
1000-1646
21-1189/T
大16开
沈阳市铁西区南十三路1号
8-165
1964
chi
出版文献量(篇)
2983
总下载数(次)
5
总被引数(次)
22269
论文1v1指导