基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基数估计是查询优化的重要组成部分,其高效性、准确性直接影响查询优化效果.传统基数估计策略基于原表或原表样本进行统计信息收集,然后利用收集好的统计信息推导出基数.该策略在数据量大时,统计信息收集效率低;统计信息存在延迟,并且基数通过推导得到,准确度无法保证;一些策略通过子查询的反馈信息得到基数,但结果没有保存,基数获取效率低.为解决这些问题,提出了一种高效准确的基于查询结果的基数估计策略(cardinality estimation based on query result,CEQR),特点是统计信息来源为查询执行结果,不需要进行推导,保证基数的准确度,并且收集效率与原表数据量无关;建立一种基数表,保存基本表和中间结果在某种谓词下的统计信息,为后续查询提供服务,并建立基数维护规则,合理管理基数表;建立资源感知策略,将基数项映射到缓存,加快统计信息获取效率.给出了基于CEQR策略的适应性以及误差分析,并通过实验得出CEQR策略在效率上优于传统基数估计策略.
推荐文章
一种基于立方体的复杂查询的高效算法
复杂查询
多特征方
多粒度聚集
一种高效基于模式图的数据库关键字查询方法
关系数据库
关键字查询
信息检索
模式图
一种支持高效检索的双重索引策略
可扩展标记语言
路径表达式
双重索引
倒排文档
一种基于对等网络的高效查询机制
对等网络
查询
DDI算法
有用性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种高效准确的基于查询结果的基数估计策略
来源期刊 西北工业大学学报 学科 工学
关键词 大数据 基数估计 查询优化 查询结果 高效 准确
年,卷(期) 2018,(4) 所属期刊栏目
研究方向 页码范围 768-777
页数 10页 分类号 TP311
字数 6840字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李战怀 西北工业大学计算机学院 254 2139 21.0 35.0
2 刘文洁 西北工业大学计算机学院 18 64 4.0 7.0
3 高锦涛 西北工业大学计算机学院 4 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (14)
参考文献  (5)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1991(1)
  • 参考文献(1)
  • 二级参考文献(0)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
大数据
基数估计
查询优化
查询结果
高效
准确
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
西北工业大学学报
双月刊
1000-2758
61-1070/T
大16开
西安市友谊西路127号(西工大校园158号信箱)
52-182
1957
chi
出版文献量(篇)
3990
总下载数(次)
4
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导