摘要:
[目的]以欧亚种葡萄'赤霞珠'(Cabernet Sauvignon)为试材,建立适于葡萄属(Vitis)植物完整叶绿体基因组组装及其特征分析的方法,为研究葡萄属植物的进化和系统发育提供方法指导.[方法]采用Illumina HiSeq PE150双末端测序策略对其全基因组DNA建库测序,建库类型为350 bp DNA小片段文库,测序深度为10倍.以已发表的拟南芥(Arabidopsis thaliana)和欧亚种葡萄'黑比诺'(Pinot Noir)的叶绿体基因组序列为参考,通过BLASTN比对提取葡萄叶绿体基因组序列,并用SOAPdenovo软件进行组装,得到'赤霞珠'完整的叶绿体基因组并对其进行特征分析.[结果]基于高通量Illumina测序,共获得5.2 G的全基因组原始数据,其中,葡萄叶绿体基因组序列为0.42 G,约占全基因组序列的8%.用抽提出来的葡萄叶绿体基因组序列成功组装出'赤霞珠'完整叶绿体基因组.特征分析表明,叶绿体基因组序列全长160676 bp,包括大单拷贝区(large single copy,LSC)、小单拷贝区(small single copy,SSC)和2个反向重复序列(inverted repeat,IRA和IRB),长度分别为89134、19072和26235 bp,具有典型被子植物叶绿体基因组环状四分体结构;共注释得到154个基因,包括99个蛋白编码基因、47个tRNA基因和8个rRNA基因;其叶绿体基因组的GC含量为37.43%;共检测到37个串联重复序列(tandem repeat sequence)和53个散在重复序列(dispersed repeats),其中,绝大部分串联重复序列的长度为11—42 bp,占叶绿体基因组序列的0.83%,而散在重复序列占叶绿体基因组序列的5.33%;此外,还检测到50个简单重复序列(simple sequence repeats,SSR)位点,大部分的SSRs均由A或T组成,同时SSRs在'赤霞珠'叶绿体基因组上的分布是不均匀的,LSC区段含有39个SSRs,而SSC区段和IR区段分别仅有7个和4个SSRs;与蛋白编码基因对应的密码子偏好使用A/T碱基,并且编码亮氨酸(L)的密码子使用频率最高,而编码半胱氨酸(C)的密码子使用频率最低;系统发育分析表明'赤霞珠'与'黑比诺'、夏葡萄(Vitis aestivalis)、圆叶葡萄(Vitis rotundifolia)亲缘关系最近.[结论]基于全基因组高通量测序的方法,成功组装出'赤霞珠'完整的叶绿体基因组,与传统获得叶绿体基因组的方法相比,此方法不需要分离叶绿体和提取cpDNA,缩短了试验时间、降低了劳动强度,并且极大地提高了试验的可行性.'赤霞珠'叶绿体基因组的基因结构、基因顺序、GC含量和密码子偏好性均与典型的被子植物叶绿体基因组类似.