基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着遥感技术的快速发展,遥感数据呈爆炸式增长,给遥感数据计算带来巨大的挑战.采用基于内存计算的Spark分布式计算框架以克服该问题,并选择YARN作为资源调度系统和采用HDFS为分布式存储系统.Spark是一个开源的分布式计算框架,基于弹性分布式数据集(RDD)概念,采用先进的有向无环图执行机制以支持循环数据流操作,通过一次数据导入内存就可以完成多次迭代运算.因而,特别适合基于多次迭代的大数据计算分析方法,相较于每轮迭代需把数据导入内存的MapReduce有更大的优势.将该计算框架应用于海量遥感数据分析,验证需要多次迭代的奇异值分解(SVD)算法在该数据分析中的有效性.实验表明,随着迭代次数增加,基于Spark的SVD运算效率相对于MapReduce有明显提高,通常可提高一个数量级.
推荐文章
基于Spark的移动用户行为 轨迹大数据分析
移动用户行为
轨迹分析
分布式处理
Spark
基于Spark的分布式大数据分析建模系统的设计与实现
分布式大数据
Spark
数据分析
数据建模
非结构化数据
故障诊断
基于区域密度划分的车辆轨迹数据分析方法研究
车联网
数据存储
集群
区域划分
路径规划
基于Spark的并行图数据分析系统
云计算
并行算法
图数据分析
数据挖掘
社会网络分析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Spark的遥感数据分析方法
来源期刊 微型电脑应用 学科 航空航天
关键词 大数据计算 遥感数据 Hadoop Spark MapReduce
年,卷(期) 2015,(8) 所属期刊栏目 开发应用
研究方向 页码范围 65-67
页数 3页 分类号 V249
字数 4529字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈峰科 复旦大学计算机科学技术学院上海市数据科学重点实验室 1 8 1.0 1.0
2 孙众毅 复旦大学计算机科学技术学院上海市数据科学重点实验室 1 8 1.0 1.0
3 池明旻 1 8 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (2)
参考文献  (3)
节点文献
引证文献  (8)
同被引文献  (6)
二级引证文献  (0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(3)
  • 引证文献(3)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
大数据计算
遥感数据
Hadoop
Spark
MapReduce
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
微型电脑应用
月刊
1007-757X
31-1634/TP
16开
上海市华山路1954号上海交通大学铸锻楼314室
4-506
1984
chi
出版文献量(篇)
6963
总下载数(次)
20
总被引数(次)
28091
论文1v1指导