基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
使用MapReduce框架对规范的一对多关系实体进行连接操作时,一方实体的各个属性会在连接的结果中产生大量冗余.通过对二次排序算法进行优化,重新定义Map阶段的分区过程、Shuffle阶段的排序及分组过程,使得Map阶段的输出为包含一方实体属性值和多方实体排序值的组合键及包含多方实体属性值的集合.Reduce阶段将组合键进行分解,提取一方实体的主码作为HBase表的行健,并将组合键中一方实体的各个属性值及多方实体属性值集合分别写入HBase表中对应的列,从而既实现了连接的语义,又消除了冗余.实验证明,优化后的算法可以消除一方实体属性值在连接结果中的冗余,提高了对连接结果的查询效率.
推荐文章
引入加权系数消除ICI的二次快时变信道估计算法
加权系数
子载波间干扰消除
二次估计
快时变信道
并行干扰消除算法
XML多值依赖及其消除冗余模式的算法
规范化
函数依赖
多值依赖
基于MDDIFXP二次规划的多操纵面冗余优化
多操纵面飞机
控制分配
不动点
优化
伪逆法
改进
二次自锁机构在电气连接中的应用
二次自锁机构
电气连接
可靠性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 消除规范关系连接冗余的二次排序算法研究
来源期刊 武汉工程大学学报 学科 工学
关键词 MapReduce 连接冗余 二次排序 HBase
年,卷(期) 2017,(5) 所属期刊栏目 机电与信息工程
研究方向 页码范围 508-513
页数 6页 分类号 TP311
字数 3137字 语种 中文
DOI 10.3969/j.issn.1674-2869.2017.05.018
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (16)
共引文献  (2061)
参考文献  (5)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(4)
  • 参考文献(1)
  • 二级参考文献(3)
2012(6)
  • 参考文献(2)
  • 二级参考文献(4)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
MapReduce
连接冗余
二次排序
HBase
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
武汉工程大学学报
双月刊
1674-2869
42-1779/TQ
大16开
武汉市江夏区流芳大道特1号,武汉工程大学流芳校区,西北区1号楼504学报编辑部收
1979
chi
出版文献量(篇)
3719
总下载数(次)
13
总被引数(次)
21485
论文1v1指导