基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了提高电信大数据处理的性能,提出了一种Spark on Yarn模式的电信大数据处理平台SY-TPP(Spark on Yarn Telecommunication Big Data Processing Platform).SY-TPP平台的实现采用Hadoop2.0的Yarn规范,运用了Spark分布式内存计算框架,使SY-TPP平台数据集的处理尽量在内存中进行.以分级聚类算法为案例分析了SY-TPP平台的编程步骤;测试结果表明:电信运营商的上GB级的用户数据能够半个工作日内完成,32物理节点的SY-TPP平台比同等配置的MapReduce平台的加速比从9.5提升10.25.
推荐文章
大数据处理平台Spark及其生物医学应用
大数据
Spark
医学研究
生物医学信息学
基于Hadoop平台的Spark快数据推荐算法分析与应用
Hadoop
Spark
快数据
ALS算法
PageRank算法
大数据处理平台比较研究
大数据平台
Hadoop
Spark
比较研究
基于Spark的医疗服务大数据 统计平台的应用
Spark
交互式分析平台
医疗服务
医疗大数据
统计系统原型
数据挖掘
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Spark on Yarn模式的电信大数据处理平台
来源期刊 福建电脑 学科 工学
关键词 云计算 电信大数据 映射-规约 Yarn规范 Spark内存计算
年,卷(期) 2019,(3) 所属期刊栏目 论著
研究方向 页码范围 34-38
页数 5页 分类号 TP393.03
字数 3259字 语种 中文
DOI 10.16707/j.cnki.fjpc.2019.03.008
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张远夏 玉林师范学院计算机科学与工程学院 11 37 4.0 5.0
2 杨玉 玉林师范学院体育健康学院 3 6 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (41)
共引文献  (143)
参考文献  (9)
节点文献
引证文献  (4)
同被引文献  (16)
二级引证文献  (0)
1967(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(5)
  • 参考文献(1)
  • 二级参考文献(4)
2009(5)
  • 参考文献(0)
  • 二级参考文献(5)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(3)
  • 参考文献(1)
  • 二级参考文献(2)
2013(8)
  • 参考文献(1)
  • 二级参考文献(7)
2014(5)
  • 参考文献(1)
  • 二级参考文献(4)
2015(8)
  • 参考文献(1)
  • 二级参考文献(7)
2016(3)
  • 参考文献(3)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(4)
  • 引证文献(4)
  • 二级引证文献(0)
研究主题发展历程
节点文献
云计算
电信大数据
映射-规约
Yarn规范
Spark内存计算
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
福建电脑
月刊
1673-2782
35-1115/TP
大16开
福州市华林邮局29号信箱
1985
chi
出版文献量(篇)
21147
总下载数(次)
86
总被引数(次)
44699
论文1v1指导