TCGA(The Cancer Genome Atlas)即肿瘤基因组图谱计划是一项由美国NCI(National Cancer Institute)和NHGRI(National Human Genome Research Institute)于2006年合作创立、共同监督的项目,是目前为止世界上最大的癌症基因信息数据库.该数据库借助于大规模测序为主的基因组分析技术,将目前人类几乎所有癌症的基因组变异与基因表达水平图谱进行绘制,这将为发现肿瘤基因组的改变以及研究其生物学分子机制提供海量的数据.目前,该数据库向科研人员免费开放,提供进行肿瘤相关研究的数据.本文的主旨是对TCGA公开数据的提取方法进行分析,从而对肿瘤学相关科研人员提供帮助.