行为识别是计算机视觉领域的一个重要研究课题,具有广泛的应用前景.针对现实中对视频整体序列结构建模会增加大量的冗余信息,提出了一种基于时空关注度长短期记忆网络(Spatial-Temporal Attention Long-Short Term Memory,STA-LSTM)的行为识别框架,提高了行为识别效率.利用GoogLeNet逐层卷积视频帧,自动聚合蕴含边、角和线等底层特征以生成具有显著结构性的高层语义特征.在LSTM中引入关注度网络来学习关注度权重,利用光流掩膜分割有效的运动前景区域,从而优化关注度权重,将其与卷积特征相结合作为STA-LSTM模型的输入特征,从而进行行为识别.在UCF101数据集上的实验结果表明,本文方法优于当前的一些先进方法.