基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着互联网的发展,网络信息呈爆炸性的增长.大量的信息一方面给人们带来了更多的消息来源,而另一方面也给人们搜索有用的信息带来巨大的负担.根据2015年11月的最新数据,互联网上活动网站的数量达到了902, 997,800个.因此如何更有效的消除互联网中的重复信息,让人们便捷的找到所求,已经成为现代互联网的一个重要的问题.布隆过滤器(Bloom Filter)是1970年提出的一种去重算法,它实际上是由一个很长的二进制向量和一系列随机映射函数组成的,拥有查询速度快和占用空间低的优点,然而其存在一定的误识别率.针对这个问题,本文设计了一种多维布隆过滤器算法,有效降低了传统布隆过滤器误识别率,并且通过实验,测试对比误称率和查询速度.
推荐文章
基于布隆过滤器的事务存储架构中的高速缓存
多核处理器
事务存储
布隆过滤器
高速缓存
基于Netfilter的实时网页内容过滤器的设计与实现
实时内容过滤
网络包过滤
gizp压缩
HTML页面文件
油水过滤器清理装置
油水泵
过滤器
清理装置
结构设计
应用
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 布隆过滤器在网页消重中的应用
来源期刊 软件 学科 工学
关键词 算法理论 多维布隆过滤器 布隆过滤器 网页消重
年,卷(期) 2015,(12) 所属期刊栏目 设计研究与应用
研究方向 页码范围 166-170
页数 5页 分类号 TP311
字数 4088字 语种 中文
DOI 10.3969/j.issn.1003-6970.2015.12.038
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 鄂海红 北京邮电大学计算机学院 20 294 10.0 17.0
2 宋美娜 北京邮电大学计算机学院 36 603 13.0 24.0
3 潘昊 北京邮电大学计算机学院 1 7 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (32)
共引文献  (25)
参考文献  (8)
节点文献
引证文献  (7)
同被引文献  (12)
二级引证文献  (1)
1970(3)
  • 参考文献(1)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(4)
  • 参考文献(0)
  • 二级参考文献(4)
2011(3)
  • 参考文献(2)
  • 二级参考文献(1)
2012(3)
  • 参考文献(0)
  • 二级参考文献(3)
2013(8)
  • 参考文献(2)
  • 二级参考文献(6)
2014(3)
  • 参考文献(2)
  • 二级参考文献(1)
2015(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(4)
  • 引证文献(3)
  • 二级引证文献(1)
研究主题发展历程
节点文献
算法理论
多维布隆过滤器
布隆过滤器
网页消重
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件
月刊
1003-6970
12-1151/TP
16开
北京市3108信箱
1979
chi
出版文献量(篇)
9374
总下载数(次)
40
论文1v1指导