基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
由于多索引哈希基于数据集中的二进制码呈均匀分布这一假设,不能有效地处理非均匀分布的数据集,故针对这一问题提出数据依赖的多索引哈希算法.首先把二进制码划分为多个连续不重合的子串,并通过计算二进制码每位之间的相关性为每一个子串学习得到自适应投影向量;在为每个子串建立哈希表时,使用投影向量对子串进行投影,从而得到哈希表中的下标;采用自适应投影的方法可以使得哈希表中的元素接近于均匀分布,进而提升了查询速度.此外,提出一个基于熵的分布度量方法,以评价哈希表中数据元素的分布情况.在大规模数据集上的实验表明,与多索引哈希算法相比,数据依赖的多索引哈希算法可以使查询速度提升36.9%~87.4%.
推荐文章
哈希索引的扩展置信规则库推理方法
扩展置信规则库
局部敏感哈希
索引优化
证据推理
高维分布式局部敏感哈希索引方法
局部敏感哈希
分布式索引
基于内容图像检索
基于多哈希算法的大规模图像快速检索方法
相似性搜索
哈希算法
倒排索引树
排序融合算法
多盘广播的偏斜索引算法
多盘广播
移动环境
调度算法
偏斜索引
调谐时间
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 数据依赖的多索引哈希算法
来源期刊 西安电子科技大学学报(自然科学版) 学科 工学
关键词 最近邻查询 二进制码 索引 多索引哈希
年,卷(期) 2015,(4) 所属期刊栏目
研究方向 页码范围 159-164
页数 6页 分类号 TP183
字数 4637字 语种 中文
DOI 10.3969/j.issn.1001-2400.2015.04.026
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 姬光荣 中国海洋大学信息科学与工程学院 51 291 10.0 13.0
2 邹海林 鲁东大学信息与电气工程学院 41 260 9.0 13.0
3 谢洪涛 中国科学院信息工程研究所信息内容安全技术国家工程实验室 6 58 4.0 6.0
4 马艳萍 中国海洋大学信息科学与工程学院 5 19 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (4)
参考文献  (7)
节点文献
引证文献  (7)
同被引文献  (9)
二级引证文献  (9)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(3)
  • 引证文献(3)
  • 二级引证文献(0)
2017(4)
  • 引证文献(0)
  • 二级引证文献(4)
2018(3)
  • 引证文献(1)
  • 二级引证文献(2)
2019(4)
  • 引证文献(1)
  • 二级引证文献(3)
研究主题发展历程
节点文献
最近邻查询
二进制码
索引
多索引哈希
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
西安电子科技大学学报(自然科学版)
双月刊
1001-2400
61-1076/TN
西安市太白南路2号349信箱
chi
出版文献量(篇)
4652
总下载数(次)
5
总被引数(次)
38780
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导