基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目的 探讨随机森林算法在肺癌高维病例-对照资料分析中的应用效果.方法 选取500例医院来源肺癌患者作为病例组,以517名社区来源对照人群作为对照组,每名研究对象均常规采集静脉抗凝血5 ml,位点基因型通过GoldenGate定制芯片平台分型,经筛选获得399个SNP位点,先利用随机森林算法进行降维,再用传统的logistic回归对降维后的变量进行分析,并采用受试者工作特征曲线(ROC)曲线下面积(AUC)分析多个SNP位点与肺癌的遗传易感性.结果 经随机森林算法筛得50个平均重要性得分最高且错误率最低的变量,其中环境变量(吸烟、年龄分组、性别)的重要性得分均位于前20,分别为4.05、3.12、1.16;在调整3个环境变量后,经阳性结果错误率(FDR)法进行多重性校正,结果仍有统计学意义的SNP位点有6个(FDR-P<0.05),而如果直接采用传统logistic回归分析,则无法发现有统计学意义的SNP位点.对于2个ROC曲线(分别为只包含环境变量模型ROC曲线、包含环境变量和SNP位点模型的ROC曲线)AUC(分别为0.6491±0.0172、0.6811±0.0166)的似然比检验结果表明,6个SNP位点与肺癌的关联性有统计学意义(X2=43.82,p=3.6×10-11).结论 利用随机森林算法先剔除高维数据的噪声位点,再利用logistic回归分析,可提高检验效能,优于直接利用logistic回归分析.
推荐文章
1485例原发性肺癌病例分析
原发性肺癌
肺肿瘤
临床
病理
病例分析
高维数据特征降维研究综述
降维
机器学习
特征选择
特征抽取
评估准则
机载高光谱影像降维方法比较
森林经理学
高光谱图像
曲线误差指数
Wilks'Lambda
随机森林
自适应波段选择
面向数据集的ST-SNE算法高维数据降维研究
数据降维
二阶邻近距离
ST-SNE
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 高维肺癌病例-对照研究资料的随机森林降维分析
来源期刊 中华预防医学杂志 学科 医学
关键词 肺肿瘤 多态性,单核苷酸 人工智能 随机森林
年,卷(期) 2012,(9) 所属期刊栏目 方法学探讨
研究方向 页码范围 845-849
页数 分类号 R734.2
字数 4378字 语种 中文
DOI 10.3760/cma.j.issn.0253-9624.2012.09.015
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (55)
共引文献  (7)
参考文献  (13)
节点文献
引证文献  (9)
同被引文献  (16)
二级引证文献  (3)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(4)
  • 参考文献(2)
  • 二级参考文献(2)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(4)
  • 参考文献(2)
  • 二级参考文献(2)
2007(7)
  • 参考文献(1)
  • 二级参考文献(6)
2008(8)
  • 参考文献(1)
  • 二级参考文献(7)
2009(15)
  • 参考文献(2)
  • 二级参考文献(13)
2010(10)
  • 参考文献(0)
  • 二级参考文献(10)
2011(11)
  • 参考文献(2)
  • 二级参考文献(9)
2012(4)
  • 参考文献(2)
  • 二级参考文献(2)
2012(4)
  • 参考文献(2)
  • 二级参考文献(2)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(2)
  • 引证文献(2)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(3)
  • 引证文献(1)
  • 二级引证文献(2)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
肺肿瘤
多态性,单核苷酸
人工智能
随机森林
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中华预防医学杂志
月刊
0253-9624
11-2150/R
大16开
北京市西城区宣武门东河沿街69号
2-61
1953
chi
出版文献量(篇)
6283
总下载数(次)
26
总被引数(次)
62212
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导