基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
数据集成环节, 越来越丰富的异构源数据给集成后数据质量的提升带来了新的挑战和困难.针对传统ETL模型在数据集成后出现的数据冗余、无效、重复、缺失、不一致、错误值及格式出错等数据质量问题, 提出了基于元数据模型控制的ETL集成模型, 并对数据集成过程中的各种映射规则进行了详细的定义, 通过将抽取、转换、加载环节的元模型和映射机制相结合, 能够有效地保证集成后数据的数据质量.提出的元模型已经应用到科技资源管理数据集成业务中.通过科技资源管理数据集成实例分析, 验证了此数据集成方案能够有效地支撑大数据环境下数据仓库的构建和集成后数据质量的提升.
推荐文章
大数据环境下云数据的访问控制技术研究
大数据
云数据
访问控制
安全维护
一种大数据环境下的数据隐私保护策略及其实践
大数据
隐私保护
细粒度访问控制
电力大数据质量评价模型及动态探查技术研究
电力大数据
元数据
数据质量
实时监控
云计算环境下的大数据特征挖掘技术研究
云计算
梯度采样
大数据
存储体系
特征挖掘
能量开销
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 大数据环境下基于元模型控制的数据质量保障技术研究
来源期刊 计算机工程与科学 学科 工学
关键词 大数据 数据仓库 ETL 元数据模型 映射 数据集成
年,卷(期) 2019,(2) 所属期刊栏目 高性能计算
研究方向 页码范围 197-206
页数 10页 分类号 TP393
字数 5928字 语种 中文
DOI 10.3969/j.issn.1007-130X.2019.02.002
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨冬菊 12 55 5.0 7.0
5 徐晨阳 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (46)
共引文献  (29)
参考文献  (8)
节点文献
引证文献  (3)
同被引文献  (9)
二级引证文献  (0)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(4)
  • 参考文献(0)
  • 二级参考文献(4)
2006(5)
  • 参考文献(0)
  • 二级参考文献(5)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(3)
  • 参考文献(2)
  • 二级参考文献(1)
2011(4)
  • 参考文献(1)
  • 二级参考文献(3)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(9)
  • 参考文献(1)
  • 二级参考文献(8)
2014(4)
  • 参考文献(0)
  • 二级参考文献(4)
2015(7)
  • 参考文献(0)
  • 二级参考文献(7)
2017(5)
  • 参考文献(4)
  • 二级参考文献(1)
2019(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
大数据
数据仓库
ETL
元数据模型
映射
数据集成
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
总被引数(次)
59030
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导