基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
据IDC统计,2011年全球处理的数据量达到1.8 ZB,预计到2020年达到40 ZB.如何对海量数据进行高效分析和有效管理已成为大数据时代亟需解决的问题之一.商业数据、科学数据和网页数据这3类海量数据的异构性(充满着非结构化、半结构化和结构化数据)进一步增加了海量数据的处理难度.海量数据排序是海量数据处理的基本内容之一.Hadoop曾利用3 658个节点的集群在16.25小时内完成1PB数据的排序,获得Daytona类GraySort和MinuteSort级别的冠军.本文在设计层面上对Hadoop平台上海量数据排序策略进行分析.
推荐文章
基于云计算技术的大规模数据聚类分析
云计算技术
大规模数据
聚类中心
相似系数
数据点密度
收敛速度
大规模数据集的多层聚类算法
谱聚类
聚类
图像分割
多媒体云计算下的大规模数据流调度方法研究
多媒体
云计算
大规模数据流
调度方法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 浅谈基于Hadoop平台的大规模数据排序
来源期刊 智能计算机与应用 学科 工学
关键词 Hadoop平台 海量数据排序 基准排序 云计算
年,卷(期) 2016,(3) 所属期刊栏目
研究方向 页码范围 130-131,134
页数 3页 分类号 TP391
字数 1971字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吕书林 河南广播电视大学信息技术中心 11 10 2.0 2.0
2 门威 河南广播电视大学信息技术中心 16 16 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Hadoop平台
海量数据排序
基准排序
云计算
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
智能计算机与应用
双月刊
2095-2163
23-1573/TN
大16开
哈尔滨市南岗区繁荣街155号(哈工大新技术楼916室)
14-144
1985
chi
出版文献量(篇)
6183
总下载数(次)
26
总被引数(次)
14240
论文1v1指导