摘要:
[背景]合成品种是由至少两种纯种(祖先)培育的新品种,旨在兼顾祖先品种的有利遗传特征,并且可以长期保持后代的杂种优势而不需要每个世代都杂交.合成品种的遗传稳定,不同于杂交群体,因而可以像纯种一样繁育.实践中,估计合成品种的祖先品种对每个动物个体基因组的遗传贡献比例,即基因组品种构成(genomic breeding composition,GBC),在畜禽品种登记、品种培育历史和品种构成分析、品种保护和杂交优势预测等方面有着非常重要的意义.利用基因组SNP基因型数据,采用合适的数学模型和统计方法,可以鉴定现有纯种品种的动物个体或纯种品种在杂交个体基因组的遗传贡献比例,而估计合成品种GBC的方法和研究都较少.[目的]线性回归是估计GBC的常用方法之一,但也存在诸多的问题.本研究旨在提出和评估一种约束的标准化线性回归方法(restricted standardized linear regression,RSLR),作为传统线性回归方法的改进方法,应用于估计合成品种动物个体的GBC.[方法]采用肉牛王牛(Beefmaster)及其3个祖先品种(婆罗门牛、海福特牛和短角牛)的GGP 50K SNP芯片所测定的基因型数据,通过计算其基因频率和欧氏距离,利用层次聚类分析方法解析了4个动物群体的遗传关系,然后提出了RSLR方法,估计合成品种动物个体GBC的原理和方法.为了检验该方法的估计效果,从基因型数据中选择了均匀分布的分别包含1000、5000、10000、20000、30000、40000个SNP以及3个祖先品种共有的47900个SNP的7个子集,分别采用RSLR和传统线性回归(linear regression,LR)两种方法估计了4323头肉牛王牛的GBC,并比较了两种方法的计算结果.[结果]聚类分析的结果与4个品种间的遗传关系相吻合,表明肉牛王牛与婆罗门牛的遗传关系最近,遗传距离小于其与海福特牛和短角牛的遗传距离.LR方法估计的GBC会低估婆罗门牛(0.459—0.462)和短角牛(0.208—0.212)对于肉牛王牛的基因组贡献,同时高估海福特牛(0.326—0.333)的基因组贡献.但RSLR方法估计的肉牛王牛GBC的平均值与3个祖先品种预期的基因组贡献比例比较吻合:婆罗门牛为0.497—0.503,海福特牛为0.262—0.274,短角牛为0.229—0.231.此外,LR方法估计GBC的标准差和变异系数明显大于用RSLR估计的结果.当SNP子集数量在20000以上时,LR方法估计牛肉王牛的3个祖先品种婆罗门牛、海福特牛和短角牛基因组贡献的标准差分别为0.048、0.032和0.051—0.052,变异系数分别为10.46%—10.50%、9.61%—9.76%和23.94%—25.00%,而RSLR方法估计的标准差,3个祖先品种对应为0.021、0.021—0.022和0.024—0.025,变异系数分别为4.18%—4.20%、7.89%—8.33%以及10.26%—10.68%.[结论]用RSLR方法估计的合成品种肉牛王牛动物个体的GBC,比LR方法的估计结果更加准确,估计的结果比LR方法估计的结果更稳定,且估计的一致性也更好,可以作为线性回归方法的改进,应用于估计合成品种动物个体GBC.