作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着计算机的普及与Internet的发展,信息技术的大量应用,人们做决策时对数据的依赖性越来越强.通过了解数据清理的概念、意义,分析数据中存在的"脏数据"、数据清理的方式、方案、流程及所用的技术与方法等.
推荐文章
基于聚类汇总的记录匹配算法
记录匹配
聚类汇总
聚类分析
关系数据库中近似重复记录的识别
数据清理
重复记录识别
字符串匹配
数据仓库
基于R-树索引的高维相似重复记录检测改进算法
SNM算法
R-树索引
高维空间特性
改进距离算法
数据稀疏性
基于内码序值聚类的相似重复记录检测方法
相似重复记录
内码序值
聚类
等级法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于记录匹配算法的记录清理研究
来源期刊 科协论坛(下半月) 学科 工学
关键词 数据清理 重复记录清理 自动分词 字段匹配 SNA
年,卷(期) 2007,(7) 所属期刊栏目 科学与研究
研究方向 页码范围 55-56,103
页数 3页 分类号 T393.03
字数 3321字 语种 中文
DOI 10.3969/j.issn.1007-3973.2007.07.034
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2007(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据清理
重复记录清理
自动分词
字段匹配
SNA
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
科协论坛(下半月)
月刊
1007-3973
42-1341/G3
大16开
湖北省武汉市
1986
chi
出版文献量(篇)
10576
总下载数(次)
28
总被引数(次)
26734
论文1v1指导