基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
用Linpack测试集测试了计算机系统浮点性能,测试用函数运算库为Goto BLAS库.该库对Linpach的测试结果有很大影响.为了提高Goto BLAS性能,观察了GotoBLAS库在龙芯3A2000处理器平台的性能表现,分析了测试软件的执行流程、数据的处理方法,根据处理器的结构特点,合理配置矩阵分块参数,优化核心循环的实现方案,同时采用软硬件数据预取技术及优化的内核TLB配置策略.在这些优化方法的共同作用下,仿真平台上核心函数的浮点部件效率超过90%.优化方案在本实验中取得了显著的效果.
推荐文章
龙芯处理器性能测试方法研究
龙芯处理器
SPEC
性能测试
国产化
基于龙芯2号处理器的SPEC 2000测试程序的分析与应用
龙芯2号
处理器
SPEC 2000
性能测试
基于LEON2处理器的SoC设计
LEON2
SoC
IP核
VHDL
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于龙芯3A2000处理器的高性能Goto BLAS库的实现
来源期刊 高技术通讯 学科
关键词 Goto BLAS 性能优化 Linpack 矩阵运算 数据预取
年,卷(期) 2016,(10) 所属期刊栏目 计算机与通信
研究方向 页码范围 825-832
页数 8页 分类号
字数 6262字 语种 中文
DOI 10.3772/j.issn.1002-0470.2016.10-11.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张华亮 中国科学院计算技术研究所计算机体系结构国家重点实验室 3 4 1.0 2.0
10 黄启印 中国科学院计算技术研究所计算机体系结构国家重点实验室 1 0 0.0 0.0
14 吴少校 中国科学院计算技术研究所计算机体系结构国家重点实验室 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (18)
共引文献  (11)
参考文献  (3)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(3)
  • 参考文献(1)
  • 二级参考文献(2)
2014(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(2)
  • 参考文献(1)
  • 二级参考文献(1)
2016(4)
  • 参考文献(0)
  • 二级参考文献(4)
2017(2)
  • 参考文献(0)
  • 二级参考文献(2)
2018(1)
  • 参考文献(0)
  • 二级参考文献(1)
2019(1)
  • 参考文献(0)
  • 二级参考文献(1)
2020(1)
  • 参考文献(0)
  • 二级参考文献(1)
2016(4)
  • 参考文献(0)
  • 二级参考文献(4)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Goto BLAS
性能优化
Linpack
矩阵运算
数据预取
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
高技术通讯
月刊
1002-0470
11-2770/N
大16开
北京市三里河路54号
82-516
1991
chi
出版文献量(篇)
5099
总下载数(次)
14
总被引数(次)
39217
论文1v1指导