基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
数据复用是数据仓库管理中节约存储空间、提高查询效率的重要手段.列存储技术将来自同一属性的数据连续存储,极大地提高了数据仓库等分析型应用软件的性能,同时增加了复用的可行性和灵活性.为此,提出了一种列存储数据仓库中的数据复用策略.首先,利用模式匹配技术发掘候选可复用列,排除大量无法复用的数据列,在此基础上对候选可复用数据进行筛选和过滤,大大降低复用数据检测的复杂度.针对确定的可复用数据,提出了基于列存储的复用实现策略,分别给出了原始数据列、压缩数据列及索引数据列的复用实现方法.最后提出了基于复用数据的查询实现技术.在大规模数据仓库基准数据集上的实验结果验证了数据复用策略在减少存储量、节省数据装载时间及提升查询性能方面的有效性.
推荐文章
支持数据仓库技术的PACS系统数据存储与检索
数据仓库
PACS系统
数据存储
数据检索
一种基于元数据仓库的元数据管理模型设计
元数据
数据仓库
知识库
CWM
一种基于信息动态打包的数据仓库的设计方法
数据仓库
信息动态打包
星形图
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种列存储数据仓库中的数据复用策略
来源期刊 计算机学报 学科 工学
关键词 数据复用 数据仓库 列存储 模式匹配 可复用数据
年,卷(期) 2013,(8) 所属期刊栏目 数据库、数据流和数据仓库
研究方向 页码范围 1626-1635
页数 10页 分类号 TP311
字数 9842字 语种 中文
DOI 10.3724/SP.J.1016.2013.01626
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 乐嘉锦 东华大学计算机科学与技术学院 131 1480 20.0 32.0
2 王梅 东华大学计算机科学与技术学院 36 264 9.0 14.0
3 周娇玲 东华大学计算机科学与技术学院 1 25 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (15)
参考文献  (3)
节点文献
引证文献  (25)
同被引文献  (29)
二级引证文献  (43)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(2)
  • 参考文献(1)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(6)
  • 引证文献(6)
  • 二级引证文献(0)
2015(11)
  • 引证文献(7)
  • 二级引证文献(4)
2016(7)
  • 引证文献(4)
  • 二级引证文献(3)
2017(13)
  • 引证文献(7)
  • 二级引证文献(6)
2018(18)
  • 引证文献(1)
  • 二级引证文献(17)
2019(10)
  • 引证文献(0)
  • 二级引证文献(10)
2020(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
数据复用
数据仓库
列存储
模式匹配
可复用数据
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
相关基金
上海市自然科学基金
英文译名:
官方网址:http://www.lawyee.net/Act/Act_Display.asp?RID=46696
项目类型:面上项目
学科类型:
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导