应用生物信息学方法,构建了一套针对cDNA或EST文库的高通量、自动化分析体系,CLASP(cDNA Library Analysis System Primary).CLASP基于Linux操作系统,主要由Perl程序构成.它以cDNA文库(ESTs)序列为分析对象,具有自动查找序列同源基因并进行染色体定位(包括细胞遗传学定位和STS定位)、EST自动延伸等功能;并对不同来源序列进行聚类分析.应用该体系对3对肺癌相关抑制性消减杂交(SSH)cDNA文库进行了分析.结果在所有3对文库的2083条EST中有1492条找到了同源基因,其中1365条得到染色体定位.对所余591条未知基因的EST进行了电子延伸,其中有214条EST得到不同程度的延伸.对上述cDNA文库中已知基因的EST以及电子延伸后的EST再分别进行聚类分析,而后综合两个聚类分析的结果,由此可发现不同文库间的共同与差异表达基因,可用于特定性状相关的基因功能预测.