基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文章利用并行计算框架MapReduce,探索数据立方体的计算问题.数据立方体的计算存在两个关键问题,一个是计算时间的问题,另一个是立方体的体积问题.随着维度的增加,计算时间将呈现指数级的增长,立方体的体积也是如此.尽管MapReduce是一个优秀的并行计算框架,但在处理数据倾斜时,分区算法不够完善,导致一些计算任务时间过长,影响整个作业的完成时间.本文通过数据采样的方式,优化数据分区,实验结果表明,数据立方体的计算的性能明显提升.为解决数据立方体体积过大的问题,在Reduce阶段将最终的结果输出到基于NoSQL的HBase数据库进行存储,HBase方便水平扩展,同时也便于日后对数据立方体的查询.
推荐文章
基于侏儒立方体的保持语义的数据立方体结构
语义
数据立方体
侏儒立方体
冰山立方体
一种生成封闭数据立方体的新算法
数据仓库
数据立方体
封闭数据立方体
Apriori
空间数据立方体的技术框架
空间数据仓库
GIS
空间数据立方体
基于超立方体容错路由算法分析
超立方体网络
容错
空闲维
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于MapReduce的数据立方体分区优化算法研究
来源期刊 信息安全与技术 学科
关键词 数据立方体 数据分区 数据分析
年,卷(期) 2014,(4) 所属期刊栏目 理论探讨
研究方向 页码范围 18-23
页数 6页 分类号
字数 5443字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 葛昂 2 5 2.0 2.0
2 张子浪 2 14 2.0 2.0
3 郑家民 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (3)
同被引文献  (11)
二级引证文献  (2)
2008(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
数据立方体
数据分区
数据分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
网络空间安全
月刊
1674-9456
10-1421/TP
16开
北京市海淀区紫竹院路66号赛迪大厦18层
82-938
2010
chi
出版文献量(篇)
3296
总下载数(次)
16
总被引数(次)
10074
论文1v1指导