基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
连接聚集操作是一种常用并且非常耗时的数据库操作.相对于准确查询,满足用户给定置信区间的近似结果由于其快得多的响应时间,更受用户的欢迎.作者分析发现现有的工作无法以既高效又满足给定的任意置信区间方式来处理近似连接聚集,因此提出了一种新的算法--(p,ε)-近似连接聚集查询(pε-AJA)来有效地返回满足任意置信区间的近似连接聚集结果.文章提出且预计算两个数据结构:连接随机样本 (JRS)和连接位置索引对表(JPIPT).利用JRS,pε-AJA向用户返回近似结果的快速响应.如果利用JRS得到的近似结果没有满足给定的置信区间,pε-AJA 利用JPIPT获得更多的随机连接元组.文中提出一种采样算法来获得JPIPT给定数量的样本,并且利用获得的JPIPT样本,该文提出的算法可通过对连接表的一遍顺序扫描获得连接元组.该文还提供了JPIPT和JRS有效的构建和维护算法.实验结果表明:pε-AJA可以获得相对于准确查询1~5个数量级的加速,并且可以有效地完成JPIPT和JRS的构建和维护操作.
推荐文章
一种传输能量固定的数据聚集调度近似算法
数据聚集
网络延时
物理干扰模型
数据调度算法
通信冲突
信噪比
SMJ:基于大纲的数据流多连接操作
自组织网络
大纲
数据流
多连接
多数据流连接算法
基于扩展符号聚集近似的水文时间序列异常挖掘
水文时间序列
异常挖掘
符号化
距离度量
基于模糊关联规则的海量数据挖掘方法研究
模糊关联规则
海量数
数据挖掘
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 海量数据上的近似连接聚集操作
来源期刊 计算机学报 学科 工学
关键词 pε-近似连接聚集 连接位置索引对表 连接随机样本 海量数据
年,卷(期) 2010,(10) 所属期刊栏目
研究方向 页码范围 1919-1933
页数 分类号 TP311
字数 11298字 语种 中文
DOI 10.3724/SP.J.1016.2010.01919
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李建中 哈尔滨工业大学计算机科学与技术学院 237 6003 33.0 72.0
2 杨东华 哈尔滨工业大学基础与交叉科学研究院高性能计算中心 11 167 7.0 11.0
3 韩希先 哈尔滨工业大学计算机科学与技术学院 11 159 6.0 11.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (6)
节点文献
引证文献  (11)
同被引文献  (7)
二级引证文献  (111)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(2)
  • 参考文献(2)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(2)
  • 引证文献(2)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(3)
  • 引证文献(3)
  • 二级引证文献(0)
2016(6)
  • 引证文献(1)
  • 二级引证文献(5)
2017(18)
  • 引证文献(1)
  • 二级引证文献(17)
2018(43)
  • 引证文献(1)
  • 二级引证文献(42)
2019(29)
  • 引证文献(1)
  • 二级引证文献(28)
2020(19)
  • 引证文献(0)
  • 二级引证文献(19)
研究主题发展历程
节点文献
pε-近似连接聚集
连接位置索引对表
连接随机样本
海量数据
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导