摘要:
[目的]鉴定辣椒HD-Zip基因家族,并利用生物信息学方法系统分析其在基因组中的分布、基因结构、进化分化特征及在不同组织中的时空表达特异性,解析该家族的进化特征及生物学功能.[方法]根据已报道及PlantTFDB数据库中的拟南芥HD-Zip序列,利用本地BLAST工具在我国辣椒测序品种‘遵辣1号’基因组中比对,并利用Pfam、SMART工具进一步验证.采用EMBOSS Programs、MEGA、GSDS、MEME、MCScanX、OrthoMCL、Circos等软件预测辣椒HD-Zip基因家族成员蛋白理化性质,构建系统进化树,定位染色体,分析基因结构、基因复制类型及直系、旁系同源基因.基于GEO数据库,运用R软件、本地perl语言及Cytoscape分析辣椒HD-Zip组织表达差异并绘制共表达网络.[结果]本研究在‘遵辣1号’基因组中鉴定获得42条辣椒HD-Zip,命名为CaHDZ01-CaHDZ42.CaHDZs长度跨度较大,70% CaHDZ蛋白的pI小于7.0.除CaHDZ42,其余基因不均匀地分布在12条染色体上,部分基因为片段复制.该基因家族可分为4个亚族,分别含有18、9、5、10个HD-Zip,基因结构及蛋白结构域差别显著.辣椒、番茄和拟南芥3个物种中的直系同源基因对数目大体相同,但同为茄科的辣椒和番茄之间的稍多;辣椒中的旁系同源基因少于番茄和拟南芥,说明辣椒基因组的倍增事件并没有使CaHDZs明显扩增.对无油樟、水稻、玉米、番茄、马铃薯、辣椒‘CM334’、辣椒‘Zunla-1’、毛果杨、葡萄以及拟南芥9个代表物种的HD-Zip进化特征分析结果表明,从被子植物开始,HD-Zip基因家族就稳定存在4个亚族.推测在形成4个亚族前,HD-Zip分为两组,其中一组分化成Ⅰ和Ⅱ亚族,而另一组则分化成为Ⅲ和Ⅳ亚族.CaHDZs在根、茎、叶、花芽、花和果实不同发育时期的表达模式分析结果显示,4个亚族具有不同程度的表达趋势.其中Ⅰ亚族基因在辣椒不同组织中的表达量均较高,且不同成员间表达模式不同,CaHDZ22在茎中的表达最高,表明该基因可能对辣椒茎的生长有重要作用.Ⅱ、Ⅲ和Ⅳ亚族基因在不同组织中的表达量相对较低,但部分基因在特定组织中具有较大的表达量.如CaHDZ34在辣椒果实成熟后期具有较大高的表达量,CaHDZ02和CaHDZ28在果实膨大时表达较高,CaHDZ04在果实成熟前期具有较高的表达量.CaHDZs表达网络中有33对基因表达趋势的相关系数(PCC)大于0.8,6对大于0.9,表明CaHDZs协同调控了辣椒的生长发育,不同亚族之间也具有协同性.[结论]在‘遵辣1号’基因组中鉴定获得42条CaHDZs,可分为4个亚族,不同亚族的基因结构、蛋白保守结构域及表达模式不同.在进化过程中,辣椒HD-Zip保守性高,数目没有明显扩增,Ⅰ和Ⅱ亚族、Ⅲ和Ⅳ亚族关系更近.CaHDZs具有组织表达差异性,协同调控了辣椒的生长发育.