基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
MinHash作为位置敏感哈希(LSH)算法中的一种,可以用来快速估算两个集合的相似度,查找网络上的重复网页或者相似新闻网页,MinHash算法使用Jaccard相似度来度量对象的相似程度.本文针对MinHash算法在分布式平台上的实现和性能表现进行分析和研究,给出了MinHash的分布式算法.最后通过具体的实验,验证了提出的MinHash算法在处理实际问题上的正确性和准确性.
推荐文章
DCAM平台下的分布式方面构件模型及协同框架的研究
双核中间件
分布式方面中间件
分布式方面构件模型
协同框架
Spark平台上的分布式SNESIM算法实现及其地质建模应用
多点地质统计
分布式计算
单正态方程模拟
Spark平台
Linux平台下目标跟踪算法研究与实现
目标跟踪
图像不变矩
遗传算法
基于Wonderware平台的分布式报警系统的设计与实现
Wonderware
分布式报警系统
电力远动系统
信息过滤
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 分布式平台下MinHash算法研究与实现
来源期刊 智能计算机与应用 学科 工学
关键词 MinHash 分布式 算法实现
年,卷(期) 2014,(6) 所属期刊栏目
研究方向 页码范围 44-46
页数 3页 分类号 TP311
字数 3527字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王洪亚 东华大学计算机科学与技术学院 19 61 3.0 6.0
2 吴西送 东华大学计算机科学与技术学院 3 18 3.0 3.0
3 任建军 东华大学计算机科学与技术学院 3 18 3.0 3.0
4 赵银龙 东华大学计算机科学与技术学院 3 18 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (10)
同被引文献  (15)
二级引证文献  (8)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(4)
  • 引证文献(4)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(4)
  • 引证文献(2)
  • 二级引证文献(2)
2019(6)
  • 引证文献(1)
  • 二级引证文献(5)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
MinHash
分布式
算法实现
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
智能计算机与应用
双月刊
2095-2163
23-1573/TN
大16开
哈尔滨市南岗区繁荣街155号(哈工大新技术楼916室)
14-144
1985
chi
出版文献量(篇)
6183
总下载数(次)
26
总被引数(次)
14240
论文1v1指导