基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着电力信息化的深入发展及移动互联网的普及,电力业务的数据结构日益复杂,数据规模呈现海量增长趋势,使得原有基于传统关系型数据库的数据处理平台出现严重的瓶颈,处理能力越来越难以满足日常的生产管理和经营决策的需求.文章通过采用基于内存计算的Spark,替代Hadoop中低效的MapReduce,并借助基于Spark之上的Shark,构建一个Hadoop+Spark+Hive+Shark海量数据高效的处理平台,相对于传统的关系型数据库和Hadoop处理平台,性能提高了20倍以上,完全满足了电力生产的性能需求.
推荐文章
大数据技术及其应用研究
大数据
系统分析结构
技术体系模型
技术应用框架
Hadoop
大数据环境下基于Spark的Bayes分类算法研究
大数据
Spark
并行流式化
贝叶斯分类
Spark数据倾斜问题研究
大数据
Spark
数据倾斜
数据处理
大数据在金融领域的应用研究
信息共享
大数据
金融云
电子政务
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Spark和Shark的大数据技术在供电企业的应用研究
来源期刊 中国电业(技术版) 学科
关键词 Spark Shark 大数据 RDD
年,卷(期) 2014,(11) 所属期刊栏目 电力信息化
研究方向 页码范围 81-82
页数 2页 分类号
字数 1530字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 龙庆麟 3 5 2.0 2.0
2 梁国辉 2 3 1.0 1.0
3 陈承志 4 11 2.0 3.0
4 李爱民 2 1 1.0 1.0
5 熊道勇 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (1)
同被引文献  (2)
二级引证文献  (3)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
Spark
Shark
大数据
RDD
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国电业(技术版)
月刊
1002-1140
11-1375/TM
16开
北京市
2011
chi
出版文献量(篇)
1725
总下载数(次)
4
论文1v1指导