一、数据质量的发展
数据质量的研究始于20世纪70年代前后,经过50多年的发展,至今已形成一系列经典的理论、技术和方法.20世纪70~90年代,是数据质量研究的萌芽阶段,那时也是电子计算机技术高速发展时期.人们在使用计算机的过程中,意识到数据的重要性,也感受到不良数据对计算任务运行的影响,但那时还没有形成比较完整的关于数据质量的知识体系.20世纪90年代后,随着以麻省理工学院(M I T)为代表的学界对数据质量问题研究的深入,全面数据质量管理(TDQM)被提出,标志着人们对数据质量的认知进入到一个构筑理论、探索方法的阶段.进入21世纪后,数据质量研究随着电子商务的高速发展逐步走向一个新的阶段,大量电子交易数据的出现以及伴随着Internet在全球的普及,数据进入到"大数据"时代,对数据质量的认知和研究越来越受到理论界和实业界的重视.