随着航空业的快速发展和新兴的众包,如Flightradar24和FlightAware等的涌现,大量空中交通数据,特别是四维(4D)航迹数据已公开于众.为了保证结果的准确性和可靠性,包括识别和减少错误在内的数据清洗,是分析4D航迹数据的第一步.为此对4D航迹数据进行如下清洗:应用反向传播神经网络算法将误差修复;用牛顿插值法对每次航行样本进行等间隔采样来获得均匀分布的4D航迹数据;进而提出一种在保持轨迹固有形状前提下的数据压缩方法,以及基于密度的有噪聚类(Density?based spatial clustering of applications with noise,DB?SCAN)对样本点中的离群点进行识别.采用欧洲空域一天的4D航迹数据集进行验证,结果表明所提方法比现有方法更高效、快速.本文的数据预处理研究结果为下一阶段的4D航迹分析奠定了基础.