基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了提高对环境空气质量监测系统中省级环境监测中心站里已汇集的海量监测数据的统计和分析效率,提出了一种基于Spark集群在Hive上进行多维数据分区的查询优化方法.以湖北省环境监测中心站中的空气质量监测数据为研究对象,将数据转移到Spark集群利用Spark SQL连接Hive并进行分区存储.设计了12种查询,查询4个数据集,通过与采用传统查询方法的实验对比得出结论.实验结果表明:基于Hive的分区优化方法对空气质量大数据的查询时间有47%到96%的优化,而随着查询的复杂程度和数据量的增加,该方法的优化效果越明显.
推荐文章
基于环境空气质量监测大数据二级索引的研究
二级索引
协处理器
值查询
HBase
基于Android的空气质量查询系统的设计与实现
空气质量查询
Android平台
SQLite数据库
上海市空气质量数据管理和查询系统的构建
数据管理
信息
查询系统
空气质量
大数据查询综述
大数据
查询
存储
处理平台
查询引擎
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Hive的空气质量大数据查询优化方法
来源期刊 武汉工程大学学报 学科 工学
关键词 Spark Hive 空气质量 大数据 查询优化
年,卷(期) 2020,(4) 所属期刊栏目 机电与信息工程
研究方向 页码范围 467-472
页数 6页 分类号 TP311
字数 4426字 语种 中文
DOI 10.19843/j.cnki.CN42-1779/TQ.202003009
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (194)
共引文献  (2110)
参考文献  (14)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(4)
  • 参考文献(0)
  • 二级参考文献(4)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(6)
  • 参考文献(0)
  • 二级参考文献(6)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(9)
  • 参考文献(0)
  • 二级参考文献(9)
2011(11)
  • 参考文献(0)
  • 二级参考文献(11)
2012(7)
  • 参考文献(0)
  • 二级参考文献(7)
2013(14)
  • 参考文献(1)
  • 二级参考文献(13)
2014(15)
  • 参考文献(1)
  • 二级参考文献(14)
2015(20)
  • 参考文献(0)
  • 二级参考文献(20)
2016(32)
  • 参考文献(2)
  • 二级参考文献(30)
2017(23)
  • 参考文献(0)
  • 二级参考文献(23)
2018(26)
  • 参考文献(5)
  • 二级参考文献(21)
2019(15)
  • 参考文献(5)
  • 二级参考文献(10)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Spark
Hive
空气质量
大数据
查询优化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
武汉工程大学学报
双月刊
1674-2869
42-1779/TQ
大16开
武汉市江夏区流芳大道特1号,武汉工程大学流芳校区,西北区1号楼504学报编辑部收
1979
chi
出版文献量(篇)
3719
总下载数(次)
13
总被引数(次)
21485
论文1v1指导