原文服务方: 计算机应用研究       
摘要:
由于各种原因,数据中存在这样或那样的脏数据需要清理(净化).特别是数据仓库、KDD及TDQM(综合数据质量管理)中,必须对数据进行清理.介绍了数据清理的有关内容、技术与实现方案,着重介绍了目前的两个重点研究、应用内容:异常发现与记录重复.
推荐文章
数据清理及其在数据仓库中的应用
数据仓库
数据清理
模式冲突
FTL(Extraction,Transformation,Loading)
数据清理中几种解决数据冲突的方法
数据清理
数据挖掘
数据仓库
数据质量
数据冲突
极端数据
基于孤立点检测的错误数据清理方法
数据挖掘
数据清理
错误数据
孤立点检测
数据融合技术综述
多传感器
数据融合
信息处理
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 数据清理综述
来源期刊 计算机应用研究 学科
关键词 数据清理 数据质量 异常 记录重复
年,卷(期) 2002,(3) 所属期刊栏目 综述评论
研究方向 页码范围 3-5
页数 3页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2002.03.002
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨辅祥 上海大学计算机系 2 102 2.0 2.0
2 刘云超 上海大学计算机系 19 251 8.0 15.0
3 段智华 上海大学计算机系 2 102 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (95)
同被引文献  (58)
二级引证文献  (160)
1983(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2003(4)
  • 引证文献(4)
  • 二级引证文献(0)
2004(4)
  • 引证文献(4)
  • 二级引证文献(0)
2005(10)
  • 引证文献(9)
  • 二级引证文献(1)
2006(20)
  • 引证文献(16)
  • 二级引证文献(4)
2007(23)
  • 引证文献(11)
  • 二级引证文献(12)
2008(20)
  • 引证文献(11)
  • 二级引证文献(9)
2009(11)
  • 引证文献(2)
  • 二级引证文献(9)
2010(21)
  • 引证文献(8)
  • 二级引证文献(13)
2011(15)
  • 引证文献(5)
  • 二级引证文献(10)
2012(12)
  • 引证文献(3)
  • 二级引证文献(9)
2013(17)
  • 引证文献(6)
  • 二级引证文献(11)
2014(13)
  • 引证文献(1)
  • 二级引证文献(12)
2015(12)
  • 引证文献(5)
  • 二级引证文献(7)
2016(15)
  • 引证文献(4)
  • 二级引证文献(11)
2017(23)
  • 引证文献(2)
  • 二级引证文献(21)
2018(21)
  • 引证文献(3)
  • 二级引证文献(18)
2019(10)
  • 引证文献(0)
  • 二级引证文献(10)
2020(4)
  • 引证文献(1)
  • 二级引证文献(3)
研究主题发展历程
节点文献
数据清理
数据质量
异常
记录重复
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导