摘要:
[目的]研究三江黄牛群体遗传多样性,从基因组层面讨论其群体遗传变异情况.[方法]提取50个体基因组总DNA,等浓度等体积混合,构建混合样本DNA池,利用CovarisS2进行随机打断基因组DNA,电泳回收长度500 bp的DNA片段,构建DNA文库.应用Illumina HiSeq 2000测序,最终得到测序数据.利用BWA软件将短序列比对到牛参考基因组(UMD 3.1),来检测三江黄牛基因组突变情况.SAMtools、Picard-tools、GATK、Reseqtools对重测序数据进行分析,Ensembl、DAVID、dbSNP数据库对SNPs和indels进行注释.[结果]全基因组重测序分析共计得到77.8 Gb序列数据,测序深度为25.32×,覆盖率为99.31%.测序得到778403444个reads和77840344400个碱基,比对到参考基因组(UMD 3.1)的reads为673670505,碱基为67341451555,匹配率分别为86.55%和86.51%,成对比对上的reads数为635242898(81.61%),成对比对上的碱基数为63512636924(81.59%);共确定了20477130个SNPs位点和1355308个indels,其中2147988个SNPs(2.4%)和90180个indels(6.7%)是新发现的.总SNPs中,鉴定出纯合SNPs989686(4.83%),杂合SNPs19487444(95.17%),纯合/杂合SNP比为1﹕19.7.转换数为14800438个,颠换为6680058个,转换/颠换(TS/TV)为2.215.剪切位点突变SNP727个,开始密码子变非开始密码子SNP117个,提前终止密码子的SNP530个,终止密码子变非终止密码子SNP88个.检测到非同义突变数为57621,同义突变为83797,非同义/同义比率为0.69.检测到非同义SNPs分布在9017个基因上,其中发现567个基因与已报道的重要经济性状相符,肉质、抗病、产奶、生长性状、生殖等相关基因的数量分别为471、77、21、10、8个,其中包括功能相重叠的基因;indels数据中,缺失数量为693180(51.15%),插入数量为662148(48.85%),纯合indels数量为161198(11.89%),杂合indels数量1194110(88.11%),大部分的变异都位于基因间隔区和内含子区;三江黄牛全基因组杂合度(H)、核苷酸多样性(Pi)及theta W分别为7.6×10-3、0.0039、0.0040,说明其遗传多样性较为丰富.三江黄牛群体Tajima'D为-0.06832,推测可能由于群体内存在不平衡选择所致.[结论]本研究为进一步分析与经济性状相关的遗传学机制和保护三江黄牛品种遗传多样性提供了基因组数据支持.