数据质量控制是智能交通系统应用建设的关键技术之一。基于对射频识别(RFID)数据特性的分析,将 RFID 冗余数据分为重复数据和相似数据,通过分析同一车辆的相邻过车时间来检测2类冗余数据。针对相似数据给出了冗余率曲线和冗余时间点的定义,解决了 RFID 交通数据中冗余数据的识别问题。针对2类冗余数据的特点,给出了2类冗余率的计算方法,提出了从基站和冗余率曲线走势2个角度出发对冗余率进行分析的方法,并给出了冗余数据的清洗方法。选取南京市区主干道上21个 RFID 基站的原始数据作为实例,对所提出的方法进行了验证。研究结果表明,21个基站采集重复数据的平均冗余率为0.0062%,相似数据的平均冗余率为0.92%,说明 RFID 数据采集技术采集到的数据具有较高可靠性。同时,各个基站采集的数据中相似数据数量远远多于重复数据数量。观察不同形状的冗余率曲线发现,冗余率曲线呈趋于平缓和尾部上升的基站冗余率较高;冗余率曲线呈直线上升的基站冗余率较低。针对分析结果,给出了相应的质量控制措施以控制 RFID 冗余数据的产生。