基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目的 介绍R环境下缺失森林算法在缺失值填补中的应用并评价其填补效果.方法 通过实际数据阐述填补估算流程,比较缺失森林算法与直接删除法处理缺失数据的效果.结果 当数据缺失率为10%时,缺失森林算法填补的效果明显优于删除法;当数据缺失率在20%时,两种方法处理缺失值的效果都不太理想,效果相近.当缺失率达50%时,3种类型的变量估算的误差已经较大,两种方法的估算效果均欠佳.结论 缺失森林算法在软件操作上简便,并且对数据结构和分布的要求宽松,可充分利用现有记录的信息,能较为准确地反应调查的真实情况,在实际工作中具有较好的应用价值.
推荐文章
一种基于双聚类的缺失数据填补方法
缺失数据填补
双聚类
双聚类数据填补
数据清洗
GBNN-填充缺失属性值算法
灰色系统
缺失数据
最近邻
LSTM在输变电设备缺失值填补中的应用
长短时记忆网络
缺失值填补
电力设备状态数据
基于时空相关性的连续缺失值填补算法
时空相关性
缺失值
传感器网络
BP神经网络
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 缺失森林算法在缺失值填补中的应用
来源期刊 中国卫生统计 学科
关键词 缺失森林 随机森林 决策树 缺失值
年,卷(期) 2014,(5) 所属期刊栏目 论著
研究方向 页码范围 774-776
页数 3页 分类号
字数 3519字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 谭红专 中南大学公共卫生学院流行病与卫生统计学系 150 1646 16.0 34.0
2 陈立章 中南大学公共卫生学院流行病与卫生统计学系 136 1312 19.0 26.0
3 胡国清 中南大学公共卫生学院流行病与卫生统计学系 71 432 12.0 17.0
4 沈琳 中南大学公共卫生学院流行病与卫生统计学系 7 158 5.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (41)
共引文献  (310)
参考文献  (6)
节点文献
引证文献  (10)
同被引文献  (22)
二级引证文献  (6)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(7)
  • 参考文献(0)
  • 二级参考文献(7)
2007(6)
  • 参考文献(0)
  • 二级参考文献(6)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(3)
  • 参考文献(1)
  • 二级参考文献(2)
2010(6)
  • 参考文献(0)
  • 二级参考文献(6)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(3)
  • 参考文献(3)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(5)
  • 引证文献(2)
  • 二级引证文献(3)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(2)
  • 引证文献(1)
  • 二级引证文献(1)
2020(5)
  • 引证文献(3)
  • 二级引证文献(2)
研究主题发展历程
节点文献
缺失森林
随机森林
决策树
缺失值
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国卫生统计
双月刊
1002-3674
21-1153/R
大16开
沈阳市和平区北二马路92号
8-39
1984
chi
出版文献量(篇)
6078
总下载数(次)
19
论文1v1指导