基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
DNS日志是互联网中重要的访问日志,数量巨大且承载着大量信息,需要借助大数据技术进行处理和分析.现网DNS日志数据量大,且数据倾斜现象严重,对MapReduce的性能有较为严重的影响.基于上述问题,采用小文件合并方法优化分片,缓解Map端的数据倾斜问题,并实现动态设置分片大小,提高MapReduce作业执行效率.该方法有效均衡了Map任务的负载,从而提高了数据倾斜情况下的MapReduce作业的执行效率和资源利用率.实验表明,使用该方法可以有效缩短MapReduce作业的执行时间.
推荐文章
异构环境下MapReduce动态任务调度技术研究
异构
MapReduce
任务调度
节点排序
任务划分
MapReduce优化技术综述
MapReduce
列存储
索引
连接
迭代
科学计算
调度算法
优化
Web日志挖掘数据预处理过程技术研究
Web日志挖掘
数据预处理
用户识别
面向MapReduce计算的大规模集群通信优化
数据通信优化
MapReduce
软件定义网络
协同数据映射
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向DNS日志的MapReduce性能优化技术研究
来源期刊 智能计算机与应用 学科 工学
关键词 DNS日志 数据倾斜 MapReduce 性能优化
年,卷(期) 2018,(2) 所属期刊栏目
研究方向 页码范围 73-77
页数 5页 分类号 TP393
字数 4134字 语种 中文
DOI 10.3969/j.issn.2095-2163.2018.02.016
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨兴华 中国科学院信息工程研究所 8 49 4.0 7.0
5 张棪 中国科学院信息工程研究所 7 45 4.0 6.0
9 刘鹤煜 中国科学院信息工程研究所 1 0 0.0 0.0
13 崔华俊 中国科学院信息工程研究所 1 0 0.0 0.0
17 谭倩 中国科学院信息工程研究所 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
DNS日志
数据倾斜
MapReduce
性能优化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
智能计算机与应用
双月刊
2095-2163
23-1573/TN
大16开
哈尔滨市南岗区繁荣街155号(哈工大新技术楼916室)
14-144
1985
chi
出版文献量(篇)
6183
总下载数(次)
26
论文1v1指导