基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统的OLAP被迅速膨胀的海量数据推动进入了大规模数据分析时代,其主要特点是存储密度大,计算强度大,需要大规模并行存储和处理能力.无论是传统的并行数据库技术还是热点的MapReduce技术都不得不面对海量数据在大规模并行处理环境下的性能和并行处理效率的问题.以星型模型上复杂多表连接为基础的OLAP算法的复杂度和并行处理过程中的数据网络传输代价都成为制约性能的重要因素.通过深入分析OLAP存储模型和查询负载特征,提出了对OLAP查询中最基础的SPJGA-OLAP子集在存储、查询处理、数据分布、网络传输和分布式缓存等方面面向海量数据大规模并行处理框架的优化策略和实现技术.通过对TPC-H和SSB两个工业界和学术界公认的测试标准的分析,评估了技术的可行性.提出了以内存predicate-vector DDTA-JOIN算法为核心的并行内存OLAP架构,以维表上规范化的谓词向量操作替代了多样的连接执行计划,实现以一种查询处理模型同时满足集中式处理和大规模并行OLAP处理的需求,充分利用现代计算机的硬件优势,最小化网络传输和OLAP查询处理代价.实验中分析了在1TB和100TB数据集中数据分布策略的存储代价和传输代价,通过并行OLAP代价模型和实际数据的实验测试验证了技术的可行性和并行处理效率.
推荐文章
海量多维数据的存储与查询研究
海量多维数据
Hadoop
数据索引
聚集查询
基于OLAP的高校数据分析与决策支持系统研究
OLAP
数据分析
决策支持
联机分析
多维引擎
数据仓库
面向海量数据的海情数据分析技术研究
海量数据
数据挖掘
数据分析
数据仓库和OLAP技术在大型施工企业财务分析中的应用
数据仓库
OLAP
施工企业
财务分析
多维数据集
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 海量数据分析的One-size-fits-all OLAP技术
来源期刊 计算机学报 学科 工学
关键词 OLAP 海量数据分析处理 谓词向量 星型模型
年,卷(期) 2011,(10) 所属期刊栏目 数据库年会优秀论文
研究方向 页码范围 1936-1946
页数 分类号 TP311
字数 9847字 语种 中文
DOI 10.3724/SP.J.1016.2011.01936
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (52)
同被引文献  (59)
二级引证文献  (183)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(5)
  • 引证文献(5)
  • 二级引证文献(0)
2013(11)
  • 引证文献(9)
  • 二级引证文献(2)
2014(19)
  • 引证文献(7)
  • 二级引证文献(12)
2015(36)
  • 引证文献(11)
  • 二级引证文献(25)
2016(53)
  • 引证文献(11)
  • 二级引证文献(42)
2017(49)
  • 引证文献(3)
  • 二级引证文献(46)
2018(29)
  • 引证文献(4)
  • 二级引证文献(25)
2019(24)
  • 引证文献(1)
  • 二级引证文献(23)
2020(9)
  • 引证文献(1)
  • 二级引证文献(8)
研究主题发展历程
节点文献
OLAP
海量数据分析处理
谓词向量
星型模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
总被引数(次)
187004
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导