基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在非平衡数据的问题上,我们实验发现随机森林无法很好的解决这一问题.本文采用了SMOTE算法,能够有效的减少和降低数据集的非平衡性.在面对医疗数据高度特征冗余的特点上,该方案使用了基于随机森林和序联合搜索的Wrapper式特征选择算法.在构造随机树时,该方案使用了Spark实现随机树的并行构建,提高了运行速率.通过对随机森林优化后的模型与随机森林、K最近邻、神经网络和向量机等模型进行对比,实验结果表明,随机森林优化算法的精度达到81.13%,优于其他的4种分类模型.
推荐文章
基于Logistic回归和随机森林算法的2型糖尿病并发视网膜病变风险预测及对比研究
2型糖尿病
视网膜病变
关联因素
风险预测
随机森林算法
Logistic回归算法
基于Spark平台和并行随机森林回归算法的短期电力负荷预测
电力大数据
分布式计算
并行随机森林回归算法
Spark平台
短期电力负荷预测
基于PCA和随机森林的故障趋势预测方法研究
趋势预测
PCA
故障诊断
随机森林
PHM
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Spark和随机森林优化的糖尿病预测
来源期刊 电子世界 学科
关键词
年,卷(期) 2021,(17) 所属期刊栏目 技术交流
研究方向 页码范围 200-201
页数 2页 分类号
字数 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
引文网络交叉学科
相关学者/机构
期刊影响力
电子世界
半月刊
1003-0522
11-2086/TN
大16开
北京市
2-892
1979
chi
出版文献量(篇)
36164
总下载数(次)
96
总被引数(次)
46655
论文1v1指导