作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在海量数据检索应用中,基于哈希算法的最近邻搜索算法有着很高的计算和内存效率。而半监督哈希算法,结合了无监督哈希算法的正规化信息以及监督算法跨越语义鸿沟的优点,从而取得了良好的结果。但其线下的哈希函数训练过程则非常之缓慢,要对全部数据集进行复杂的训练过程。 HAMA是在Hadoop平台基础上,按照分布式计算BSP模型构建的并行计算框架。本文尝试在HAMA框架基础上,将半监督哈希算法的训练过程中的调整相关矩阵计算过程分解为无监督的相关矩阵部分与监督性的调整部分,分别进行并行计算处理。这使得使得其可以水平扩展在较大规模的商业计算集群上,使得其可以应用于实际应用。实验表明,这种分布式算法,有效提高算法的性能,并且可以进一步应用在大规模的计算集群上。
推荐文章
基于有监督哈希的肺结节CT图像检索
肺结节
图像检索
多特征提取
有监督哈希
自适应权重
分类
基于无监督哈希算法的车辆图像快速检索
无监督哈希
三元组
卷积神经网络
车辆图像
快速检索
面向Web图像检索的基于语义迁移的无监督深度哈希
语义迁移
图像哈希
Web图像检索
深度学习
MFASSC:基于间隔Fisher分析的半监督聚类方法
半监督聚类
成对约束
间隔Fisher分析
数据降维
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于HAMA的半监督哈希方法
来源期刊 计算机系统应用 学科
关键词 无监督哈希算法 BSP模型 分布式计算 Hadoop平台 HAMA框架 矩阵计算
年,卷(期) 2014,(11) 所属期刊栏目 软件技术?算法
研究方向 页码范围 169-174
页数 6页 分类号
字数 5286字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 朱明 中国科学技术大学自动化系 228 2519 25.0 40.0
2 刘扬 中国科学技术大学自动化系 115 1133 16.0 30.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
无监督哈希算法
BSP模型
分布式计算
Hadoop平台
HAMA框架
矩阵计算
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
论文1v1指导