摘要:
[目的]玉米起源于热带地区,经过自然和人工选择,广泛的种植于温带地区.开花是玉米生长发育的中心环节,也是热带玉米向温带环境种植的主要适应性性状.鉴定玉米在驯化过程中出现的受选择基因区段,并进一步挖掘开花候选基因,为玉米的群体改良、开花遗传机理解析提供数据支撑.[方法]首先单独分析30份温带玉米自交系和21份热带玉米自交系的单倍型数据,通过过滤高缺失和等位基因频率较低的变异位点,得到高质量的SNP (single nucleotide polymorphism)标记,利用SnpEff软件对温带和热带玉米群体的基因组多态性位点进行了功能预测.其次过滤得到同时存在于温带和热带玉米的高质量SNP标记,对温带和热带玉米的基因型数据进行主成分分析(principle component analysis,PCA)以确定其群体结构,之后利用群体分化指数(fixation index,FST)和群体间扩展单倍型纯合度(cross population extended haplotype homozygosity,XP-EHH)法分析温带和热带玉米群体间的选择信号分布情况,选择FST和XP-EHH值的top 1%为阈值,筛选得到受选择位点.通过对SNP进行功能注释得到温热带玉米群体受到选择的基因.利用agriG0工具对候选驯化基因进行功能富集分析.利用相关的生物信息学数据库对候选基因进行功能注释,进一步鉴定玉米驯化过程中的开花候选基因.[结果]通过对温热带玉米群体的高测序深度的SNP进行分析,发现热带玉米群体的SNP数目为14 123 408个,温带玉米群体的SNP数目为8 791 673个,鉴定到的SNP主要分布于基因间区.2个群体中均存在的SNP标记数目是204 752个.主成分分析表明温带和热带玉米可以显著的分为两个类群.FST择信号的top 1%是0.3593,共鉴定到557个候选驯化基因,XP-EHH选择信号法的top 1%是3.2681,共鉴定到1 913个候选基因.鉴定到多个候选基因与玉米的开花调控密切相关,包括ZmCCT9、COL1、GRMZM2G387528.如ZmCCT9抑制开花基因ZCN8的表达,导致玉米在长日照环境下出现晚花表型,是一个重要的开花调控基因;COL1与开花促进因子FT蛋白互作,加速玉米开花以适应长日照环境;GRMZM2G387528的功能注释揭示该基因是一个光敏色素互作因子,与光周期基因ZmphyB1互作.[结论]热带玉米群体具有更高的遗传多态性,筛选到一系列参与了热带玉米和温带玉米的分化候选基因,并且重点挖掘了参与其中的玉米开花调控相关基因.