蛋白质互作用网络是一种典型的复杂网络,呈现了明显的社区结构.网络中的社区对应于功能模块,通常被看作蛋白质复合物.蛋白质复合物识别对预测蛋白质功能,解释特定生物进程具有重要作用.基于种子节点扩展的图聚类方法在蛋白质复合物识别中应用广泛.针对此类算法最终结果受种子节点的影响较大,并且在簇的形成过程中搜索空间有限等问题,提出了一种基于遗传算法的蛋白质复合物识别算法GAGC(ge-netic algorithm based graph clustering),其中个体表示聚类结果(类别之间可能存在重叠节点),以F-measure值作为种群进化的目标函数.算法采用IPCA(improvement development clustering algorithm)算法产生初始种群;针对初始种群,设计了染色体对齐方式以进行交叉操作产生下一代种群.通过与DPClus、MCODE、IPCA、ClusterOne、HC-PIN、CFinder等经典算法的对比实验表明,GAGC算法能够扩大图聚类算法的搜索空间,提高解的多样性,进而提高蛋白质复合物检测的性能.