基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目的 比较删除法(deletion methods,DM)、基于对数线性模型的多重填补法(multiple imputation of category variables using log-linear model,MILL)及基于潜在类别模型的多重填补法(multiple imputation based on latent class model,MILC)处理分类变量缺失数据的效果,并将MILC应用于实例数据的分析.方法 利用R语言产生不同缺失机制、缺失率和样本含量的多变量缺失模拟数据,运用DM、MILL和MILC处理形成完整数据集并进行logistic回归分析,通过回归系数的偏倚、均方根误差、稳定度和标准误偏倚评价各方法的处理效果.结果 模拟实验表明当缺失率为5%时,三种方法处理效果均较好;随着缺失率的增大,MILL和MILC的各项评价指标均优于DM,且MILC的准确度高于MILL.三种方法处理效果均表现为完全随机缺失优于随机缺失、样本含量1000优于样本含量500.应用MILC对实例数据填补后标准误减小,回归系数估计更准确.结论 本文应用MILL和MILC两种多重填补方法处理分类变量缺失数据均可减少缺失导致的参数估计偏倚.当缺失率>5%、样本含量1000时,建议应用MILC处理分类变量缺失数据.
推荐文章
生物缺失数据处理的贝叶斯模型研究
缺失数据
朴素贝叶斯
分类
UCTD数据处理方法研究
走航式温盐深剖面测量仪
下降速度
数据处理
改进的数据流缺失数据处理算法
数据流
检测
缺失数据
用于气动导数辨识的试飞数据处理方法研究
试飞数据处理
时间延迟修正
相容性检验
输出误差法
气动导数辨识
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 分类变量缺失数据处理方法有效性的比较研究
来源期刊 中国卫生统计 学科
关键词 分类变量 缺失数据 多重填补 潜在类别模型 对数线性模型
年,卷(期) 2016,(2) 所属期刊栏目 论著
研究方向 页码范围 186-189
页数 4页 分类号
字数 2963字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘美娜 哈尔滨医科大学卫生统计教研室 79 514 13.0 17.0
2 陈永杰 哈尔滨医科大学卫生统计教研室 12 76 6.0 8.0
3 王玉鹏 哈尔滨医科大学卫生统计教研室 6 25 4.0 5.0
4 肖亚明 哈尔滨医科大学卫生统计教研室 2 7 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (3)
参考文献  (3)
节点文献
引证文献  (7)
同被引文献  (30)
二级引证文献  (4)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(4)
  • 引证文献(2)
  • 二级引证文献(2)
2020(4)
  • 引证文献(2)
  • 二级引证文献(2)
研究主题发展历程
节点文献
分类变量
缺失数据
多重填补
潜在类别模型
对数线性模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国卫生统计
双月刊
1002-3674
21-1153/R
大16开
沈阳市和平区北二马路92号
8-39
1984
chi
出版文献量(篇)
6078
总下载数(次)
19
论文1v1指导