基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对目前基于动态规划查询超图(dynamic programming hypergraphs,DPhyp)优化SQL查询算法产生指数运行时间、传统代价模型难以直接适用于Impala大数据实时查询系统等问题,提出基于改进DPhyp算法的Impala查询优化方法.首先,构建满足左线性树的搜索策略,缩小整个执行计划的搜索空间;接着,综合考虑数据移动代价及Hash join算法运行等关键因素,结合提出的代价模型,生成最佳的join顺序;最后,在生成的join顺序基础上构建执行计划,执行后返回最终查询结果.大量实验结果表明,改进的DPhyp算法与DPhyp生成的join顺序一致,且前者算法运行效率比后者要快近一倍.另外,改进的DPhyp算法结合提出的代价模型,比原始的Impala查询响应时间平均减少67%~80%.
推荐文章
基于改进和声搜索群算法的数据库查询优化
数据库
数学模型
查询优化
和声搜索算法
基于MTR与Impala结合的数据查询优化研究
大数据
Map-Trim-Reduce
mpala
基于粒子群算法的数据库查询优化
查询优化
粒子群算法
数据库查询优化
分组查询
基于粒子群算法的数据库查询优化
查询优化
粒子群算法
查询策略
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于改进DPhyp算法的Impala查询优化
来源期刊 计算机研究与发展 学科 工学
关键词 查询超图 代价模型 Impala大数据实时查询 左线性树 执行计划
年,卷(期) 2013,(z2) 所属期刊栏目 大数据处理、查询与检索
研究方向 页码范围 114-120
页数 7页 分类号 TP311
字数 5768字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈岭 浙江大学计算机科学与技术学院 48 269 9.0 14.0
2 周强 浙江大学计算机科学与技术学院 60 351 12.0 15.0
3 吴勇 7 48 4.0 6.0
4 马骄阳 浙江大学计算机科学与技术学院 1 7 1.0 1.0
5 赵宇亮 浙江大学计算机科学与技术学院 1 7 1.0 1.0
6 王敬昌 10 62 5.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (4)
节点文献
引证文献  (7)
同被引文献  (4)
二级引证文献  (64)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(2)
  • 引证文献(2)
  • 二级引证文献(0)
2015(10)
  • 引证文献(2)
  • 二级引证文献(8)
2016(23)
  • 引证文献(1)
  • 二级引证文献(22)
2017(13)
  • 引证文献(0)
  • 二级引证文献(13)
2018(12)
  • 引证文献(2)
  • 二级引证文献(10)
2019(10)
  • 引证文献(0)
  • 二级引证文献(10)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
查询超图
代价模型
Impala大数据实时查询
左线性树
执行计划
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机研究与发展
月刊
1000-1239
11-1777/TP
大16开
北京中关村科学院南路6号
2-654
1958
chi
出版文献量(篇)
7553
总下载数(次)
35
总被引数(次)
164870
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导