作者:
原文服务方: 广东通信技术       
摘要:
HIVE使用类SQL语言大大简化了HDFS上数据管理操作,但是由于其计算引擎基于MapReduce,因此在部分数据操作上存在限制,其中不支持关联操作中的不等值链接条件就是其中一个例子.本文通过对HIVE关联过程的分析,针对HIVE现有计算框架无法直接实现不等值关联,需要通过先关联再筛选的关联方式导致计算量较大的情况,提出结合业务场景和业务目标进行针对性优化,并且结合案例进行分析与性能优化.
推荐文章
基于Spark的两表等值连接过程优化
Spark
等值连接
大数据
优化
拆分
一种基于区域不变矩的图像特征关联方法
特征关联
区域分割
区域不变矩
相似性度量
一种基于粒子群优化的关联规则挖掘方法
关联规则挖掘
粒子群优化算法
支持度
置信度
最优规则
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于业务特征优化HIVE中两个大表不等值关联的方法
来源期刊 广东通信技术 学科
关键词 大数据 HIVE 关联 优化
年,卷(期) 2017,(11) 所属期刊栏目 新技术·新业务
研究方向 页码范围 52-55
页数 4页 分类号
字数 语种 中文
DOI 10.3969/j.issn.1006-6403.2017.11.011
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈喜洲 中国电信股份有限公司广州研究院 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
大数据
HIVE
关联
优化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
广东通信技术
月刊
1006-6403
44-1221/TN
大16开
1981-01-01
chi
出版文献量(篇)
4474
总下载数(次)
0
总被引数(次)
11090
论文1v1指导