基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了加快卷积神经网络模型的计算速度,便于大规模神经网络模型在嵌入式微处理器中的实现,以FT-matrix2000向量处理器体系结构为研究背景,通过对多核向量处理器体系结构的分析和对卷积神经网络算法的深入研究,提出将规模较小的卷积核数据置于标量存储体,尺寸较大的卷积矩阵置于向量存储体的数据布局方案.针对矩阵卷积中数据难以复用的问题,提出根据卷积核移动步长的不同动态可配置的混洗模式,通过对所取卷积矩阵元素进行不同的移位操作,进而大幅提高卷积矩阵数据的复用率.针对二维矩阵卷积由于存在数据相关性进而难以多核并行的问题,提出将卷积矩阵多核共享,卷积核矩阵多核独享的多核并行方案.设计了卷积核尺寸不变、卷积矩阵规模变化和卷积矩阵尺寸不变、卷积核规模变化的两种计算方式,并在主流CPU、GPU、TI6678、FT-matrix2000平台进行了性能对比与分析.实验结果表明:FT-matrix2000相比CPU最高可加速238倍,相比TI6678可加速21倍,相比GPU可加速663 805倍.
推荐文章
基于三值逻辑光学处理器实现向量矩阵乘法
向量矩阵乘法
光学向量矩阵乘法
光学处理器
三值逻辑
基于三值逻辑光学处理器实现向量矩阵乘法
向量矩阵乘法
光学向量矩阵乘法
光学处理器
三值逻辑
二维加窗全相位图像卷积滤波模板的设计
二维全相位滤波
二维窗函数
方块效应
滤波模板
卷积在数字图像处理中的应用
数字图像处理
卷积
应用
图像增强
平滑滤波
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 二维矩阵卷积在向量处理器中的设计与实现
来源期刊 国防科技大学学报 学科 工学
关键词 卷积神经网络 向量处理器 多核实现 矩阵卷积
年,卷(期) 2018,(3) 所属期刊栏目 电子科学与技术·信息与通信工程
研究方向 页码范围 69-75
页数 7页 分类号 TP391
字数 5483字 语种 中文
DOI 10.11887/j.cn.201803011
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郭阳 国防科技大学计算机学院 50 449 9.0 20.0
2 张军阳 国防科技大学计算机学院 3 116 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (18)
共引文献  (61)
参考文献  (11)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(2)
  • 参考文献(2)
  • 二级参考文献(0)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(5)
  • 参考文献(1)
  • 二级参考文献(4)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(3)
  • 参考文献(0)
  • 二级参考文献(3)
2013(2)
  • 参考文献(1)
  • 二级参考文献(1)
2014(3)
  • 参考文献(3)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
卷积神经网络
向量处理器
多核实现
矩阵卷积
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
国防科技大学学报
双月刊
1001-2486
43-1067/T
大16开
湖南省长沙市开福区德雅路109号
42-98
1956
chi
出版文献量(篇)
3593
总下载数(次)
5
总被引数(次)
31889
论文1v1指导