基于CMAC(cerebella model articulation controller)提出一种动态强化学习方法(dynamic cerebella model articulation controller-advantage learning,DCMAC-AL).该方法利用advantage(λ)learning计算状态一动作函数,强化不同动作的值函数差异,以避免动作抖动;然后在CMAC函数拟合基础上,利用Bellman误差动态添加特征值,提高CMAC函数拟合的自适应性.同时,在RoboCup仿真平台上对多智能体防守任务(takeaway)进行建模,利用新提出的算法进行学习实验.实验结果表明,DCMAC-AL比采用CMAC的advantage(λ)learning方法有更好的学习效果.