原文服务方: 计算机应用研究       
摘要:
多表连接查询是大数据分析领域重要的查询类型之一,然而连接查询的实现代价很高,从而影响了大数据分析结果的时效性.在线聚集能够在查询完成前反馈具有统计意义的估计结果具有重要的意义.目前已有的多表连接在线聚集算法从各表进行统一随机采样,导致连接结果的产出率低,并且导致分组连接查询的估计准确率低.针对这一问题,提出了基于马尔可夫链的多表连接在线聚集技术,将多表连接的实现过程转换为马尔可夫链上的随机游走过程,确定好连接顺序后在游走起始层创建分层样本,并设计了相应的采样策略及结果估计方法.将所提出技术在在线化Hadoop平台上实现,实验结果证明所提出方案的响应时间优于已有算法,并且具有良好的扩展性.
推荐文章
基于支持向量机-马尔可夫链的位移时序预测
支持向量机
马尔可夫链
位移时间序列
粒子群优化
基于马尔可夫链样本模拟的线抽样方法研究
失效概率
马尔可夫链
线抽样
低周疲劳寿命
基于灰色马尔可夫链的核设备退化趋势预测
核设备
灰色马尔可夫链
退化趋势
预测
基于粒子群算法的自回归加权马尔可夫链的负荷预测
PSO算法
自回归模型
加权马尔可夫链
预测
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 MC-OLA:基于马尔可夫链的多表连接在线聚集技术
来源期刊 计算机应用研究 学科
关键词 在线聚集 马尔可夫链 分层采样 多表连接
年,卷(期) 2019,(12) 所属期刊栏目 软件技术研究
研究方向 页码范围 3801-3805,3810
页数 6页 分类号 TP392
字数 语种 中文
DOI 10.19734/j.issn.1001-3695.2018.07.0384
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杜方 宁夏大学信息工程学院 9 119 3.0 9.0
2 史英杰 北京服装学院信息工程学院 5 8 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (12)
共引文献  (1)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1952(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(3)
  • 参考文献(1)
  • 二级参考文献(2)
2016(2)
  • 参考文献(0)
  • 二级参考文献(2)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
在线聚集
马尔可夫链
分层采样
多表连接
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导