以Homo.sapiens brain为库,选取编号为CA423810的EST序列,联网到NCBI调用Blast服务器分析,该EST序列是一个代表新基因的未知序列.以该序列作为电子探针,通过Internet采用Blast软件进行GenBank的EST数据库检索,获得了该序列的电子延伸产物EST重叠群.经与人类基因组草图进行序列校正,获得了全长为2 232bp的cDNA序列.利用NCBI的ORFfinder服务器,分析发现该序列具有完整的阅读框架,从而确定了基因的全长cDNA序列.该基因定位于染色体上的5q22,编码由388个氨基酸组成,分子量为44859的蛋白质.运用RTP-CR技术,以新基因电子克隆全长cDNA序列设计基因特异性引物,以11例癌组织及相应的正常组织的cDNA、人胎脑cDNA文库和人睾丸cDNA文库为模板扩增目的片段,并以看家基因GAPDH为内对照,检测目的基因的mRNA表达水平.研究结果表明,新基因只在睾丸组织中高表达,在直肠癌、结肠癌、宫颈癌、胃癌等的癌组织及相应的正常组织中都无明显的表达.因此将该新基因命名为睾丸组织高表达基因(testis high expression,THE).以上结果提示,THE基因可能是在人脑中表达的同一基因的不同剪接本.关键词检索UniGene数据.