作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
Spark是高速计算引擎,在计算能力上优于MapReduce.Spark采用的是内存计算方式,而Spark SQL在基于Hive数仓数据的分布式计算上尤为广泛.重点研究Spark SQL在进行海量数据的分类查询时,对处理大数据计算的性能进行优化建议.大数据的分类、查询和大数据处理的两个重要方向,引入了改进的随机森林算法提高数据分类的准确性,优化遗传算法缩短了查询时间,在对海量大数据进行实时分类、查询的场景中具有指导意义.
推荐文章
大数据环境下基于Spark的Bayes分类算法研究
大数据
Spark
并行流式化
贝叶斯分类
基于Spark Streaming的海量日志实时处理系统的设计
大数据
SparkStreaming
日志分析
分布式计算
基于无共享架构的海量感知数据实时处理系统
感知数据
实时处理
云计算
智能交通
基于Web服务的海量风暴潮灾害数据实时可视化研究
风暴潮灾害
海量数据
实时可视化
Web服务
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Spark SQL的海量数据实时分类查询算法的研究
来源期刊 黄河科技学院学报 学科
关键词 Spark SQL 随机森林算法 遗传算法
年,卷(期) 2021,(5) 所属期刊栏目 信息工程研究
研究方向 页码范围 35-38
页数 4页 分类号 TP311.13
字数 语种 中文
DOI 10.19576/j.issn.2096-790X.2021.05.007
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (46)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(4)
  • 参考文献(0)
  • 二级参考文献(4)
2014(8)
  • 参考文献(0)
  • 二级参考文献(8)
2015(2)
  • 参考文献(0)
  • 二级参考文献(2)
2016(11)
  • 参考文献(0)
  • 二级参考文献(11)
2017(4)
  • 参考文献(0)
  • 二级参考文献(4)
2018(5)
  • 参考文献(0)
  • 二级参考文献(5)
2019(4)
  • 参考文献(0)
  • 二级参考文献(4)
2020(3)
  • 参考文献(3)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Spark SQL
随机森林算法
遗传算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
黄河科技学院学报
双月刊
1008-5424
41-1279/N
大16开
河南省郑州市紫荆山南路666号
1999
chi
出版文献量(篇)
497
总下载数(次)
4
论文1v1指导