基因芯片技术是基因组学中的重要研究工具.而基因芯片数据(微阵列数据)往往是高维的,使得降维成为微阵列数据分析中的一个必要步骤.本文对美国哈佛医学院G.J.Gordon等人提供的肺癌微阵列数据进行分析.通过t-test,Wilcox-on秩和检测分别提取微阵列数据特征属性,后根据CART(Classification and Regression Tree)算法,以Gini差异性指标作为误差函数,用提取的特征属性广延的构造分类树;再进行剪枝找到最优规模的树,目的是提高树的泛化性能使得能很好适应新的预测数据.实验证明:该方法对肺癌微阵列数据分类识别率达到96%以上,且很稳定;并可以得到人们容易理解的分类规则和分类关键基因.