基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目的 探讨随机森林(RF)的变量捕获方法在高维数据变量筛选中的应用.方法 通过模拟实验和实际数据分析,对两种变量捕获(vh.md,vh.vimp)和逐步剔除方法(varSelRF)进行比较,并通过选人变量的数目、模型预测错误率(PE)和受试者工作特征曲线下面积(AUC)对其进行评价.结果 模拟实验表明,在变量具有联合作用、交互作用和弱独立作用情况下,变量捕获方法均明显优于varSelRF方法和全变量VIMP排序方法;实际数据分析结果表明,变量捕获方法筛选变量结果稳定,并能够保证良好的预测效果.结论 变量捕获方法适用于高维数据的变量筛选,具有实用价值.
推荐文章
主变量筛选法在武器型号费用数据处理中的应用
主变量筛选法
多重相关性
降维
费用数据
描述森林结构的重要变量
森林结构
量化表达
结构参数
面向多变量的WSN层次化数据融合方法
无线传感器网络
数据融合
多变量
向量压缩
多项式回归
仿真实验
模糊变量与随机变量组合时的模糊可靠度计算方法
模糊变量
随机变量
模糊安全事件
隶属函数
模糊可靠度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 随机森林的变量捕获方法在高维数据变量筛选中的应用
来源期刊 中国卫生统计 学科
关键词 随机森林 变量筛选 变量捕获
年,卷(期) 2015,(1) 所属期刊栏目 论著
研究方向 页码范围 49-53
页数 5页 分类号
字数 4146字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李康 哈尔滨医科大学卫生统计学教研室 95 646 15.0 21.0
2 侯艳 哈尔滨医科大学卫生统计学教研室 39 143 6.0 10.0
3 宋欠欠 哈尔滨医科大学卫生统计学教研室 2 20 2.0 2.0
4 李轶群 哈尔滨医科大学生物信息教研室 2 14 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (28)
共引文献  (20)
参考文献  (9)
节点文献
引证文献  (14)
同被引文献  (24)
二级引证文献  (18)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(4)
  • 参考文献(0)
  • 二级参考文献(4)
2004(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(7)
  • 参考文献(1)
  • 二级参考文献(6)
2007(8)
  • 参考文献(1)
  • 二级参考文献(7)
2008(5)
  • 参考文献(3)
  • 二级参考文献(2)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(4)
  • 引证文献(3)
  • 二级引证文献(1)
2017(6)
  • 引证文献(4)
  • 二级引证文献(2)
2018(11)
  • 引证文献(2)
  • 二级引证文献(9)
2019(7)
  • 引证文献(4)
  • 二级引证文献(3)
2020(4)
  • 引证文献(1)
  • 二级引证文献(3)
研究主题发展历程
节点文献
随机森林
变量筛选
变量捕获
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国卫生统计
双月刊
1002-3674
21-1153/R
大16开
沈阳市和平区北二马路92号
8-39
1984
chi
出版文献量(篇)
6078
总下载数(次)
19
论文1v1指导