基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着计算机硬件性能的提高,目前在个人终端上也开始出现使用预训练机器学习模型进行推理的运用.Caffe是一款流行的深度学习框架,擅长图像分类等任务,但是在默认状态下只能单核运行,无法充分发挥异构并行计算设备的计算能力.深度学习对于计算性能的要求较高,如果能并行化以充分使用所有计算设备,就能提升计算速度和使用体验.由于CPU和GPU的计算性能之比在不同模型下存在差异,因此不能简单将任务均分到多个计算设备.而任务拆分过多或者需要等待多设备完成任务后同步的调度算法会引入更多开销.因此,还需要设计合适的调度算法减少设备空闲时间,才能获得更好的性能.已有一些提高Caffe并行表现的方法,但是对于具体平台有限制且使用难度较高,无法简单充分利用异构并行计算设备的计算能力.本文将Caffe接口扩展,使得自定义程序可以调用异构并行平台的多核或多计算设备使用Caffe进行深度学习推理.接着将目前已有的多种调度算法运用到此类任务上并考察了运行效果.为了减少已有调度算法的同步开销,本文提出了先进先出调度和快速分块调度两种新的算法.测试表明,使用快速分块调度算法结合异构并行计算设备,Caffe的推理速度相比只使用单个CPU核心或者单个GPU都大幅提升.而且,相比已有调度算法中表现最好的HAT算法,本文提出的快速分块调度算法在MNIST和Cifar-10两个数据集上分别减少了7.4%和21.0%的计算性能浪费.
推荐文章
基于Caffe的嵌入式多核处理器深度学习框架并行实现
深度学习
移动端
前向计算
并行
OpenCL
基于异构平台的 BH 算法高效并行实现
N 体问题
BH 算法
异构平台
并行计算
基于异构多核的CCA并行构件模型
并行计算
并行构件
异构多核处理器
并行构件模型
基于异构知识集成推理策略的研究
异构知识
集成推理
求解策略
模块综合
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 异构并行平台的Caffe推理速度提升方法
来源期刊 计算机系统应用 学科
关键词 调度算法 Caffe推理加速 快速分块调度算法 异构并行平台调度 深度学习性能优化
年,卷(期) 2022,(2) 所属期刊栏目 软件技术 · 算法|Software Technique · Algorithm
研究方向 页码范围 220-226
页数 7页 分类号
字数 语种 中文
DOI 10.15888/j.cnki.csa.008320
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
调度算法
Caffe推理加速
快速分块调度算法
异构并行平台调度
深度学习性能优化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
论文1v1指导