基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着计算机网络的迅猛发展和大数据时代的到来,数据越来越频繁地呈现出多属性异构的特点.这种包含多种不同类型属性的大数据流称为异构大数据流(Heterogeneous Big Data Streams).在面向大规模数据在线监测分析的应用中,通常需要在异构大数据流上注册大规模监测规则.因此,对于每一个数据流元组,必须用最小的计算开销满足所有的规则.同时,由于大数据流上监测规则集异常庞大,提高规则监测的性能是大规模数据流在线监测的关键.基于此,该文提出一种层次化的索引结构H-Tree及其在线规则匹配算法.具体的,H-Tree将大数据流上的属性集划分为离散型属性和连续型属性.基于不同的属性集,构建两层索引结构:在第1层,通过改进的红黑树对离散型谓词构建触发索引;在第2层,通过量化连续型谓词构建多维索引结构.H-Tree的在线规则匹配算法利用关联关系表对两层索引的监测结果进行融合过滤.实验分析表明,与经典的R+方法相比较,H-Tree通过层次化的索引结构,在不降低准确度的前提下,显著提升了大数据流的监测效率.
推荐文章
QDM-Tree:支持数据流频繁更新的Cache敏感索引
频繁更新
Cache敏感
索引树
数据流
浅谈一种面向大数据行业的智能搜索引擎技术
大数据
智能
搜索引擎
框架
应用
一种存储和索引历史数据流数据的方法
数据流
历史查询
抽样
存储
索引
B+树
时态拟序数据索引TQD-tree
时态拟序与线序划分
时态数据索引
数据查询与增量式更新
仿真与评估
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 H-Tree:一种面向大数据流在线监测的层次索引
来源期刊 计算机学报 学科 工学
关键词 异构大数据流 监测规则 索引
年,卷(期) 2015,(1) 所属期刊栏目 大数据
研究方向 页码范围 35-44
页数 10页 分类号 TP309
字数 8013字 语种 中文
DOI 10.3724/SP.J.1016.2015.00035
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李军 中国科学院计算技术研究所信息安全研究中心 329 5514 37.0 61.0
3 方滨兴 中国科学院计算技术研究所信息安全研究中心 50 1129 17.0 33.0
14 臧文羽 中国科学院计算技术研究所信息安全研究中心 2 106 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (14)
同被引文献  (7)
二级引证文献  (7)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(4)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(4)
  • 二级引证文献(0)
2015(4)
  • 引证文献(4)
  • 二级引证文献(0)
2016(4)
  • 引证文献(4)
  • 二级引证文献(0)
2017(4)
  • 引证文献(4)
  • 二级引证文献(0)
2018(5)
  • 引证文献(1)
  • 二级引证文献(4)
2019(3)
  • 引证文献(0)
  • 二级引证文献(3)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
异构大数据流
监测规则
索引
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导