基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对现有的近似查询模型对查询精度的可控性较差,后续处理效率较低的问题,提出基于两级过滤的查询模型.通过采用不同粒度的SAX表示方法提取时间序列的字符型特征向量,可以将高维的时间序列映射到低维的特征空间;将不同粒度的特征向量以向量近似文件(VA-File)的结构进行存储,有效引入了倒排索引.在查询过程中,设计了启发式的查询过滤算法,根据粗粒度特征向量查询细粒度特征向量,实现第一级过滤;针对VA-File设计了高效的边界剪枝算法,实现第二级过滤.模型基于多粒度的SAX特征向量进行构建,可以对查询精度进行有效控制;在第二级过滤中采用的边界剪枝算法可以有效地提高后续处理的执行效率.实验结果表明,提出的查询模型具有较高的性能,对时间序列长度、kNN查询规模及数据集规模具有稳定的扩展性.
推荐文章
基于Irdeto的两级CA系统
前端
机顶盒
智能卡
自动投矾-微絮两级陶粒直接过滤净水的试验研究
自动投矾
微絮凝
低浊水
直接过滤
基于极值点特征的时间序列相似性查询方法
时间序列
相似性查询
数据挖掘
基于投机执行的两级退休机制
投机执行
重排序缓存
快速退休
乱序回写
超标量
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于两级过滤的时间序列近似查询
来源期刊 浙江大学学报(工学版) 学科 工学
关键词 时间序列 相似性查询 符号聚集近似 向量近似文件 倒排索引
年,卷(期) 2016,(7) 所属期刊栏目 计算机技术、信息工程
研究方向 页码范围 1290-1297,1321
页数 9页 分类号 TP39
字数 7081字 语种 中文
DOI 10.3785/j.issn.1008-973X.2016.07.010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 孙建伶 浙江大学计算机科学与技术学院 33 544 9.0 23.0
2 陈岭 浙江大学计算机科学与技术学院 48 269 9.0 14.0
3 蔡青林 浙江大学计算机科学与技术学院 1 2 1.0 1.0
4 梅寒蕾 浙江大学计算机科学与技术学院 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (8)
节点文献
引证文献  (2)
同被引文献  (2)
二级引证文献  (0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
时间序列
相似性查询
符号聚集近似
向量近似文件
倒排索引
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
浙江大学学报(工学版)
月刊
1008-973X
33-1245/T
大16开
杭州市浙大路38号
32-40
1956
chi
出版文献量(篇)
6865
总下载数(次)
6
总被引数(次)
81907
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导