基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在许多应用领域中,大规模浮点矩阵乘法往往是最耗时的计算核心之一.在新兴的应用中经常存在至少有一个维度很小的大规模矩阵,我们把具备这种特性的矩阵称为非均匀矩阵.由于FPGA上用以存储中间结果的片上存储器容量十分有限,计算大规模矩阵乘法时往往需要将矩阵划分成细粒度的子块计算任务.当加速非均匀矩阵乘法时,由于只支持固定分块大小,大多数现有的线性阵列结构的硬件矩阵乘法器将遭受很大的性能下降.为了解决这个问题,提出了一种有效的优化分块策略.在此基础上,在Xilinx公司的Zynq XC7Z045 FPGA芯片上实现了一个支持可变分块的矩阵乘法器.通过集成224个处理单元,该矩阵乘法器在150 MHz的时钟频率下对于实际应用中的非均匀矩乘达到了48 GFLOPS的实测性能,而所需带宽仅为4.8 GB/s.实验结果表明,我们提出的分块策略相比于传统的分块算法实现了高达12%的性能提升.
推荐文章
用于加速器电源的一种矩阵变换器拓扑研究
加速器电源
功率因数
矩阵整流
一种医用直线加速器机械参数测量分析系统
医用直线加速器
机械参数
双目光学测量套件
分析报告
直线感应加速器的优化设计与仿真
电磁场
直线感应加速器
补偿
场路耦合
有限元
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种支持优化分块策略的矩阵乘加速器设计
来源期刊 计算机工程与科学 学科 工学
关键词 FPGA 非均匀矩阵 矩阵乘法 分块策略
年,卷(期) 2016,(9) 所属期刊栏目 高性能计算
研究方向 页码范围 1748-1754
页数 7页 分类号 TP391
字数 3233字 语种 中文
DOI 10.3969/j.issn.1007-130X.2016.09.002
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 乔寓然 国防科学技术大学计算机学院 2 5 1.0 2.0
2 杨乾明 国防科学技术大学计算机学院 8 28 3.0 4.0
3 文梅 国防科学技术大学计算机学院 9 25 3.0 4.0
4 沈俊忠 国防科学技术大学计算机学院 1 4 1.0 1.0
5 肖涛 国防科学技术大学计算机学院 1 4 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (4)
节点文献
引证文献  (4)
同被引文献  (8)
二级引证文献  (2)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(4)
  • 引证文献(2)
  • 二级引证文献(2)
研究主题发展历程
节点文献
FPGA
非均匀矩阵
矩阵乘法
分块策略
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
总被引数(次)
59030
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导