原文服务方: 湖南大学学报(自然科学版)       
摘要:
BLAS库是基本线性代数子程序库,是许多大型科学与工程计算的核心计算程序,FitenBLAS库是在多核多线FT1000微处理器上开发的基本线性代数库,其研制对FT1000微处理器在科学与工程计算中的应用具有重要意义.根据多级存储结构和寄存器的数目,设计了向量与向量、矩阵与向量和矩阵与矩阵运算的多级循环展开方法,采用指令调度、数据预取等通用优化技术,优化BLAS库串行程序.对于BLAS3子程序,设计了矩阵乘无冗余数据拷贝分块算法,采用指令重排、访存与计算的重叠、分块等技术优化矩阵乘子程序,基于矩阵乘子程序实现了其他BLAS3子程序.研制了汇编线性代数程库Fiten-BLAS,其核心子程序矩阵乘的双精度计算性能达到6.91Gflops,是峰值性能的86.4%.
推荐文章
面向TensorFlow和PyTorch的线性代数基准测试
线性代数
TensorFlow
Pytorch
高性能计算
矩阵乘法
面向FT1000微处理器的STREAM并行计算与优化
多线程微处理器
STREAM测试程序
性能优化
高性能低功耗32位浮点RISC微处理器的研究
精简指令系统
微处理器
总线预选器
高阶布斯算法
低功耗架构
高性能低功耗的32位RISC微处理器HMS30 C7202
嵌入式系统
微处理器
ARM
接口
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 FitenBLAS:面向FT1000微处理器的高性能线性代数库
来源期刊 湖南大学学报(自然科学版) 学科
关键词 FT1000微处理器 BLAS库 性能优化
年,卷(期) 2015,(4) 所属期刊栏目 电气和信息工程
研究方向 页码范围 100-106
页数 7页 分类号 TP332.2
字数 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (4)
节点文献
引证文献  (1)
同被引文献  (2)
二级引证文献  (0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
FT1000微处理器
BLAS库
性能优化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
湖南大学学报(自然科学版)
月刊
1674-2974
43-1061/N
16开
1956-01-01
chi
出版文献量(篇)
4768
总下载数(次)
0
总被引数(次)
41941
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导