作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
设计并实现基于分布式平台的大数据分析处理系统,基于Spark平台用以处理大规模时间序列数据.系统框架主要分为存储层、算子层和算法层.在存储层,系统基于HDFS和Hive完成对大规模时间序列数据的组织和索引.在算子层,系统为用户提供了Spark平台上时间序列数据常用的基本操作,并允许用户直接使用这些算子实现自定义的时间序列相关处理算法.在算法层,系统实现Spark平台中一些常用的时间序列分析算法,包括时间序列相似度查询、聚类和预测,用户可以直接使用这些算法进行时间序列分析.通过对系统性能和功能的测试,验证了该系统的可行性和实用性.
推荐文章
基于Spark的分布式大数据分析建模系统的设计与实现
分布式大数据
Spark
数据分析
数据建模
非结构化数据
故障诊断
基于分布式文件系统的智慧医疗大数据平台
J2EE
健康医疗
大数据
关系型数据库
分布式文件系统
中国新医改
基于TTFC网络的分布式综合化处理系统平台研究
DIPS
TTFC网络
通用系统管理
分布式综合化处理系统平台
大数据环境下Hadoop分布式系统的研究与设计
大数据
高并发
高存储
高扩展性和可用性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于分布式平台的大数据分析处理系统
来源期刊 电脑编程技巧与维护 学科
关键词 分布式平台 大数据 聚类 预测 Spark平台
年,卷(期) 2022,(2) 所属期刊栏目 数据库与信息管理
研究方向 页码范围 81-83
页数 3页 分类号
字数 语种 中文
DOI 10.3969/j.issn.1006-4052.2022.02.026
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
分布式平台
大数据
聚类
预测
Spark平台
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电脑编程技巧与维护
月刊
1006-4052
11-3411/TP
大16开
北京市海淀区长春桥路5号六号楼1209室
82-715
1994
chi
出版文献量(篇)
14554
总下载数(次)
80
总被引数(次)
25630
论文1v1指导