摘要:
[目的]分析德国小蠊Blattella germanica全基因组中微卫星的数量和分布规律,并对外显子中含有微卫星的基因进行功能注释.[方法]使用微卫星搜索软件查找德国小蠊基因组中微卫星的数量、重复次数以及所有微卫星的位置信息,编写Python脚本对微卫星进行定位,并通过Blast2Go和KASS程序对外显子中含有微卫星的基因进行功能注释.[结果]共找到1~6碱基重复类型的微卫星序列604 386个,总长度15 301 255 bp,约占全基因组序列(约2.04 Gb)的0.75%,分布频率为1/3.37 kb,微卫星序列的长度主要在12 ~60个碱基长度范围内.不同类型的微卫星中,三碱基(226 876)重复类型微卫星数量最多,占微卫星总数的37.54%;四碱基(150 355)重复类型次之,占微卫星总数的24.88%;其余依次是单碱基(141 167)、二碱基(60 877)、五碱基(21 570)和六碱基(3 541)重复类型,分别占微卫星总数的23.36%,10.07%,3.57%和0.59%.出现最多的重复拷贝类别有:ATT,AAT,A,T,AAAT,ATTT和AT,共411 789个微卫星,占微卫星总数的68.13%,这7种类别的微卫星数量均大于30 000个.共有2 372个微卫星在外显子上,它们分别位于1 481个基因上.GO功能注释结果表明,其中434条归类于细胞组分(cellular component),402条归类于分子功能(molecular function),660条归类于生物学过程(biological process).KEGG通路分析结果表明,与新陈代谢相关的基因最多(380个),其次是与机体系统相关的(276个),与遗传信息进程相关的基因最少(92个).[结论]本研究为进一步系统深入分析德国小蠊微卫星功能及微卫星分子标记筛选打下了基础.