原文服务方: 科技与创新       
摘要:
随着计算机技术的飞速发展,各个领域的数据量呈指数上升,如何处理大体量的数据以保证数据的质量和可用性是机器学习建模过程中不可缺少的一部分。作为建模的首要部分,数据预处理技术的精度直接影响算法的性能。在已有研究的基础上提出了一种新颖的数据预处理方法,将数据预处理过程的不同方面集成到一起,构造出基于集成的数据预处理方法,最后在UCI数据库中(UCI数据库是加州大学欧文分校University of California Irvine提出的用于机器学习的数据库)3个经典数据集的基础上进行实证研究,并使用决策树、支持向量机、神经网络这3种机器学习算法来验证集成数据预处理技术的可行性和提高预测性能的有效性。
推荐文章
集成数据选择特征基因
集成数据
基因选择
分类
机器学习算法在数据挖掘中的应用
数据挖掘
BP 神经网络
遗传优化算法
空压机故障诊断
机器学习算法对旅游数据的挖掘应用
机器学习算法
数据挖掘
户外定位
地震观测集成数据库的优化研究
地震观测集成数据库
高可用环境
数据库优化
SQL优化
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 集成数据预处理技术及其在机器学习算法中的应用
来源期刊 科技与创新 学科
关键词 数据预处理 集成方法 机器学习 UCI数据集
年,卷(期) 2024,(23) 所属期刊栏目 实践应用
研究方向 页码范围 169-171
页数 3页 分类号
字数 语种 中文
DOI 10.15913/j.cnki.kjycx.2023.23.049
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2024(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据预处理
集成方法
机器学习
UCI数据集
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
科技与创新
半月刊
2095-6835
14-1369/N
大16开
2014-01-01
chi
出版文献量(篇)
41653
总下载数(次)
0
总被引数(次)
202805
论文1v1指导