基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
模糊哈希算法广泛应用于同源相似文件的检索、恶意代码检测、电子数据取证等领域。模糊哈希算法首先依据文件长度和文件内容检测对文件进行分片,再对每一个分片进行滚动哈希运算,最后将各分片的哈希值连接在一起,形成文件指纹,实现了具有局部敏感特性的近似最邻近搜索。文章采用了关键词触发的变长分片策略和基于simhash的滚动哈希计算方法对现有的模糊哈希算法进行改进,克服了分片长度依赖于文件长度、触发条件与分片中内容无紧密联系、运算性能受滚动窗口长度制约的缺陷。基于多种语料库的文件比较实验表明,文章提出的改进模糊哈希算法可以有效地实现同源相似文件的发现,且具备支持多级信息粒度比较的能力。
推荐文章
一种改进的基于模糊-粗糙集的属性约简算法
粗糙集
模糊-粗糙集
属性约简
一种改进的全参考模糊度比值算法
模糊度
全参考
客观评价
基于改进主动哈希的URL存储和查找算法
业务选择网关
CRC
哈希
访问度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于改进模糊哈希的文件比较算法研究
来源期刊 信息网络安全 学科 工学
关键词 模糊哈希 局部敏感 文件比较 滚动哈希
年,卷(期) 2016,(11) 所属期刊栏目 技术研究
研究方向 页码范围 12-18
页数 7页 分类号 TP309
字数 6589字 语种 中文
DOI 10.3969/j.issn.1671-1122.2016.11.003
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王连印 9 73 4.0 8.0
2 邸宏宇 1 4 1.0 1.0
3 张静 1 4 1.0 1.0
4 于毅 1 4 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (39)
共引文献  (19)
参考文献  (8)
节点文献
引证文献  (4)
同被引文献  (1)
二级引证文献  (0)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(6)
  • 参考文献(1)
  • 二级参考文献(5)
2011(4)
  • 参考文献(0)
  • 二级参考文献(4)
2012(5)
  • 参考文献(0)
  • 二级参考文献(5)
2013(3)
  • 参考文献(1)
  • 二级参考文献(2)
2014(7)
  • 参考文献(1)
  • 二级参考文献(6)
2015(10)
  • 参考文献(2)
  • 二级参考文献(8)
2016(3)
  • 参考文献(3)
  • 二级参考文献(0)
2016(3)
  • 参考文献(3)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
模糊哈希
局部敏感
文件比较
滚动哈希
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息网络安全
月刊
1671-1122
31-1859/TN
大16开
上海岳阳路76号4号楼211室
4-688
2001
chi
出版文献量(篇)
7165
总下载数(次)
26
总被引数(次)
26089
论文1v1指导