基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
对数据质量,尤其是数据清洗的研究进行了综述.首先说明数据质量的重要性和衡量指标,定义了数据清洗问题.然后对数据清洗问题进行分类,并分析了解决这些问题的途径.最后说明数据清洗研究与其他技术的结合情况,分析了几种数据清洗框架.最后对将来数据清洗领域的研究问题作了展望.
推荐文章
基于大数据的数据清洗研究
数据清洗
方差分量
大数据
长程依赖
多级模型
时间序列
科技创新大数据清洗框架研究
科技创新大数据
数据质量
数据清洗
数据清洗框架
过程数据的应用层次和数据获取研究
过程数据
批次数据
有效数据
中文数据清洗研究综述
中文数据清洗
数据质量管理
数据集成
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 数据质量和数据清洗研究综述
来源期刊 软件学报 学科 工学
关键词 数据质量 数据清洗 数据集成 相似重复记录 数据清洗框架
年,卷(期) 2002,(11) 所属期刊栏目
研究方向 页码范围 2076-2082
页数 7页 分类号 TP311
字数 6845字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 周傲英 复旦大学智能信息处理开放实验室 79 5708 32.0 75.0
5 郭志懋 复旦大学智能信息处理开放实验室 5 606 5.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (71)
参考文献  (3)
节点文献
引证文献  (513)
同被引文献  (432)
二级引证文献  (1759)
1974(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(3)
  • 参考文献(0)
  • 二级参考文献(3)
1981(1)
  • 参考文献(0)
  • 二级参考文献(1)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2003(3)
  • 引证文献(3)
  • 二级引证文献(0)
2004(12)
  • 引证文献(10)
  • 二级引证文献(2)
2005(36)
  • 引证文献(23)
  • 二级引证文献(13)
2006(63)
  • 引证文献(24)
  • 二级引证文献(39)
2007(102)
  • 引证文献(32)
  • 二级引证文献(70)
2008(115)
  • 引证文献(45)
  • 二级引证文献(70)
2009(92)
  • 引证文献(27)
  • 二级引证文献(65)
2010(98)
  • 引证文献(35)
  • 二级引证文献(63)
2011(107)
  • 引证文献(32)
  • 二级引证文献(75)
2012(137)
  • 引证文献(36)
  • 二级引证文献(101)
2013(180)
  • 引证文献(52)
  • 二级引证文献(128)
2014(142)
  • 引证文献(30)
  • 二级引证文献(112)
2015(172)
  • 引证文献(26)
  • 二级引证文献(146)
2016(198)
  • 引证文献(39)
  • 二级引证文献(159)
2017(257)
  • 引证文献(33)
  • 二级引证文献(224)
2018(248)
  • 引证文献(34)
  • 二级引证文献(214)
2019(227)
  • 引证文献(23)
  • 二级引证文献(204)
2020(83)
  • 引证文献(9)
  • 二级引证文献(74)
研究主题发展历程
节点文献
数据质量
数据清洗
数据集成
相似重复记录
数据清洗框架
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
总被引数(次)
226394
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导