原文服务方: 计算机应用研究       
摘要:
在线聚集通过统计计算估计查询结果,能够在查询完成前给用户反馈,在大数据分析领域具有重要意义.现有研究工作采用统一随机采样策略,当查询出现小分组或低选择率时,导致估计结果不准确及收敛速度缓慢.针对这一问题,提出了结合负载特征和数据分布进行多维分层采样的有偏采样策略,并结合大数据处理平台Storm设计了结果估计和置信区间计算方法.实验证明所提出的方案有效提高了在线聚集估计结果的准确度,并且具有良好的扩展性.
推荐文章
基于多维分层采样的时间维度型大数据流整合系统设计
数据流整合
多维分层采样
数据采集
数据质量检测
模型搭建
系统设计
网络大数据的分层调度技术研究
网络环境
大数据调用
多维度调用
分层调度
调度结构
数据传输
基于粒矩阵的动态大数据多维关联性分析技术
动态大数据
多维关联性
粒矩阵
PSO算法
大数据粒化
数据处理
基于Kylin实现大数据多维分析
大数据
KYLIN
OLAP
CUBE
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 MSOLA:基于多维分层采样的大数据在线聚集技术
来源期刊 计算机应用研究 学科
关键词 在线聚集 大数据 多维分层采样 负载分析
年,卷(期) 2018,(2) 所属期刊栏目 算法研究探讨
研究方向 页码范围 375-380
页数 6页 分类号 TP392
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2018.02.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杜方 宁夏大学信息工程学院 9 119 3.0 9.0
2 史英杰 北京服装学院信息工程学院 5 8 2.0 2.0
3 尤亚东 北京服装学院信息工程学院 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (36)
参考文献  (2)
节点文献
引证文献  (2)
同被引文献  (8)
二级引证文献  (0)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
在线聚集
大数据
多维分层采样
负载分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
论文1v1指导