基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
数据清洗是大数据中一个重要的主题.本文基于Hadoop设计并实现了一个大数据的云清洗系统.通过Map-Reduce计算模型,该系统能够检测并修复数据质量方面的各类问题.该系统包含以下特征:(1)支持数据质量方面各类问题的清洗工作;(2)数据云清洗进度可视化以及参数设置;(3)友好的数据集输入接口以及清洗后的数据集输出接口.该大数据云清洗系统对文本数据和数据库数据均是一个有效且高效的数据清洗系统.
推荐文章
面向智能家居大数据云存储系统设计与实现
智能家居
大数据存储
云存储
远程遥控
基于云计算的海量大数据智能清洗系统设计
云计算
海量大数据
智能清洗系统
云聚类
查准率
召回率
导弹健康管理大数据云平台架构研究
导弹健康管理
大数据
云平台
Hadoop
MapReduce
时空大数据推荐系统设计与实现
时空大数据
推荐系统
用户画像
产品特征库
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 大数据云清洗系统的设计与实现
来源期刊 智能计算机与应用 学科 工学
关键词 大数据 数据质量 云清洗 Map-Reduce
年,卷(期) 2015,(3) 所属期刊栏目
研究方向 页码范围 88-90
页数 3页 分类号 TP391
字数 3411字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王海洁 哈尔滨工业大学网络与信息中心 8 25 3.0 5.0
2 黄沈滨 哈尔滨工业大学网络与信息中心 4 37 3.0 4.0
3 朱振华 哈尔滨工业大学计算机科学与技术学院 3 8 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (4)
同被引文献  (7)
二级引证文献  (15)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(5)
  • 引证文献(1)
  • 二级引证文献(4)
2018(7)
  • 引证文献(1)
  • 二级引证文献(6)
2019(5)
  • 引证文献(0)
  • 二级引证文献(5)
研究主题发展历程
节点文献
大数据
数据质量
云清洗
Map-Reduce
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
智能计算机与应用
双月刊
2095-2163
23-1573/TN
大16开
哈尔滨市南岗区繁荣街155号(哈工大新技术楼916室)
14-144
1985
chi
出版文献量(篇)
6183
总下载数(次)
26
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导