摘要:
利用已经公布的粗糙脉孢菌基因组测序结果,对该真菌基因组中的微卫星(SSR)序列进行了系统分析.结果表明,在已经公布的38.0 Mb的基因组序列中,共有14 788个以1~6个核苷酸为基序的SSR序列(长度大于15 bp,匹配值大于80%),其碱基总数占整个基因组碱基数的0.95%,平均2.57 kb就分布有一个大于15 bp的SSR.其中数量最多的三碱基SSR,数量达到4 7 2 9个,其次为六碱基SSR(2 940个)和单碱基SSR(2 489个),这3类SSR总数达10158个,占SSR总数的68.7%.数量最少的是二碱基SSR,只有691个.在可读框(ORF)中的SSR总数为4 094个,共分布于2 37 3个ORF中,其中只有1个SSR的ORF为1 05 6个.与其它生物内SSR的分布类似,在基因编码区中,以三碱基SSR和六碱基SSR占绝对优势,分别为基因组中三碱基和六碱基SSR总数的54.1%和48.8%,由于ORFs和编码区的碱基总数分别为该菌基因组碱基总数的约46%和38.3%,所以这两种长度的SSR在编码区中的密度高于基因组中的平均密度.ORF上下游300 bp调控区域内是各类SSR相对的富集区.尤其是上游区域中的五碱基SSR,为平均密度的3倍,二碱基SSR和四碱基SSR的密度也是基因组中平均密度的2倍多.在下游调控序列中,五碱基、四碱基、二碱基、单碱基SSR的密度,也大大超过了在基因组中的平均密度.在粗糙脉孢菌的64 840 bp线粒体DNA中也发现47个SSR,平均为1.4 kb就有1个SSR分布,其组成特点与基因组中的SSR类似.这些结果说明,SSR在基因组上的分布趋向于集中在基因组中的调控区域.