摘要:
目的 分析比较不同肿瘤基质评分胃癌患者的基因表达特征,鉴定与评分相关的胃癌预后基因,以期为临床胃癌诊断和预后提供更精准的手段.方法 从癌症基因组图谱数据库(the cancer genome atals,TCGA)下载胃癌的临床资料和组织转录组测序(ribonucleic acid sequencing,RNAseq)表达数据.从基质免疫评估数据库(estimation of stromal and immune cells in malignant tumor tissues using expression data,ESTIMATE)网站下载TCGA数据库中胃癌患者基质评分信息.获取患者的临床信息、RNAseq表达谱、基质评分.按照基质评分的高低分为高基质评分组和低基质评分组,分析基质评分与胃癌预后的关系.用R语言DEseq2包进行标准化处理和差异分析;WGCNA(weight correlation network analysis,WGCNA)包筛选与基质评分密切相关的差异基因;单因素COX风险比例回归模型(COX proportional model,COX)初步筛选基质评分密切相关基因中与胃癌预后相关的基因;LASSO(least absolute shrinkage and selection operator,LASSO)回归模型筛选出其中影响胃癌预后的关键基因,计算最小λ值;多因素COX回归分析构建关键基因胃癌预后模型,并量化基因表达量与患者生存时间的关系;模型内部绘制关键基因的生存曲线.最后通过其他公共数据库(KM-plotter数据库和Oncomine数据库)验证这些基因在胃癌大样本的表达和预后.结果 基质评分越高的患者表现为预后更差(P<0.05).对患者的RNA-seq差异表达分析筛选得到1 581个差异表达基因;从中通过WGCNA筛选出1 015个基因与胃癌基质评分密切相关;单因素COX回归选出377个基因与胃癌患者预后相关(P<0.05);LASSO回归筛选出12个与胃癌预后相关的关键基因,最小λ=12;多因素COX回归分析显示该模型C指数为0.68,3年生存期和5年生存期的预测值基本贴合实际值,3年生存期曲线下面积(area under the curve,AUC)为0.693,5年生存时间AUC为0.725.12个基因中,ACTA1、ADAMTS 12、LINCO1614、MATN3、MTUS2、PLCL1、POSTN、SERPINE1、TPTEP1表达量越高,患者生存期越短,GAD1和MMP16表达量的越低,患者生存期越短;6个基因(ADAMTS12、MATN3、MEGF10、PLCL1、POSTN、SERPINE)各自作为独立危险因素,具有最佳的胃癌预后预测功能(P<0.05).KM-plotter数据库和Oncomine数据库符合本研究的预测结果.结论 肿瘤基质评分越高的胃癌患者,预后更差、生存周期更短.6个基因ADAMTS12、MEGF10、PLCL1、POSTN、MATN3、SERPINE与患者的肿瘤基质评分及预后密切相关.其表达越高,患者评分越高,预后越差、生存周期越短.本研究鉴定了与胃癌基质评分相匹配的预后基因,提示胃癌基质研究的进一步方向.