基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目前处理时态大数据连接操作多数运用分布式系统, 但现有的分布式系统尚不能支持原生的时态连接查询, 无法满足时态大数据低延迟和高吞吐量的处理需求.为此, 提出一个基于Spark的二级索引内存解决方案.运用全局索引进行分布式分区的剪枝, 使用局部时态索引进行分区内查询, 提高数据检索效率.针对时态数据设计分区方法, 以对全局剪枝进行优化.基于真实和合成数据集的实验结果表明, 与基准方案相比, 该方案可明显提高时态连接操作的处理效率.
推荐文章
大数据环境下Hadoop分布式系统的研究与设计
大数据
高并发
高存储
高扩展性和可用性
云计算环境下分布式大数据多信道并行控制系统
云计算环境
分布式大数据
多信道
并行控制
多路处理
同步存储
分布式网络环境下海洋大数据服务技术研究
分布式网络
海洋大数据
服务技术
数字海洋
基于Hadoop分布式系统的地质环境大数据框架探讨
大数据
地质环境数据
Hadoop生态系统
云计算
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 分布式环境下时态大数据的连接操作研究
来源期刊 计算机工程 学科 工学
关键词 时态大数据 分布式内存计算 时态连接 二级索引 分区方法 Spark框架
年,卷(期) 2019,(3) 所属期刊栏目 云计算与大数据专题
研究方向 页码范围 20-25,31
页数 7页 分类号 TP391
字数 4144字 语种 中文
DOI 10.19678/j.issn.1000-3428.0052626
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张伟 上海交通大学计算机科学与工程系 113 657 14.0 19.0
2 王志杰 中山大学数据科学与计算机学院 2 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (9)
共引文献  (4)
参考文献  (4)
节点文献
引证文献  (3)
同被引文献  (10)
二级引证文献  (0)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(1)
  • 参考文献(0)
  • 二级参考文献(1)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(3)
  • 引证文献(3)
  • 二级引证文献(0)
研究主题发展历程
节点文献
时态大数据
分布式内存计算
时态连接
二级索引
分区方法
Spark框架
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导