基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
BLAS (Basic Linear Algebra Subprograms)是一个基本线性代数操作的数学函数标准, 该库函数分为三个级别, 每个级别提供了向量与向量(1级)、向量与矩阵(2级)、向量与向量(三级)之间的基本运算. 本文研究了在申威1621处理器上BLAS一级函数的优化方案, 以函数AXPY为例, 充分利用平台的架构特点对其进行性能调优,设计了自动的线程分配方案. 实验结果显示优化过后的BLAS一级函数AXPY相对于GotoBLAS参考实现版本的单核和多核加速比分别高达4.36和9.50, 对于每种优化方式均得到了一定的性能提升.
推荐文章
基于申威众核处理器的NSGA-Ⅱ并行和优化方法
申威众核处理器
NSGA-Ⅱ
并行遗传算法
多目标
并行优化
基于申威26010处理器的扩展函数库实现与优化
浮点运算
数学函数
申威26010处理器
数据分段
指令调度
基于LEON2处理器的SoC设计
LEON2
SoC
IP核
VHDL
基于ARM的PC/104处理器模块设计
PC/104
ARM
嵌入式系统
Linux
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于申威1621处理器的BLAS一级函数优化
来源期刊 计算机系统应用 学科
关键词 申威1621 BLAS 并行 线程分配 SIMD向量化
年,卷(期) 2021,(7) 所属期刊栏目 研究开发|Research and Development
研究方向 页码范围 246-252
页数 7页 分类号
字数 语种 中文
DOI 10.15888/j.cnki.csa.008000
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (34)
共引文献  (9)
参考文献  (13)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(3)
  • 参考文献(2)
  • 二级参考文献(1)
2011(7)
  • 参考文献(2)
  • 二级参考文献(5)
2012(8)
  • 参考文献(0)
  • 二级参考文献(8)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(3)
  • 参考文献(1)
  • 二级参考文献(2)
2015(6)
  • 参考文献(1)
  • 二级参考文献(5)
2016(4)
  • 参考文献(2)
  • 二级参考文献(2)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(2)
  • 参考文献(1)
  • 二级参考文献(1)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
申威1621
BLAS
并行
线程分配
SIMD向量化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
论文1v1指导