基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
STREAM是微处理器上内存性能的基准测试程序,在多核多线程FT1000微处理器上发挥高性能是具有挑战性的研究工作.基于多级Cache结构,优化STREAM四个程序的指令流水线,根据寄存器数,设计了多级循环展开方法,根据指令延迟和Cache行的大小确定数据预取的数目,使用汇编语言编写了优化子程序.基于OpenMP并行环境,设计了STREAM并行程序,优化了局部化数据分配方式.数据测试结果表明,优化后的STREAM的性能比原始串行程序性能提高了19.2%~64.2%.优化后,并行程序的最高访存性能达到8.5 GB/s,对比优化前的最高访存性能最大提高了22.7%.
推荐文章
FitenBLAS:面向FT1000微处理器的高性能线性代数库
FT1000微处理器
BLAS库
性能优化
FitenBLAS:面向FT1000微处理器的高性能线性代数库
FT1000微处理器
BLAS库
性能优化
基于并行计算的数字信号处理器
并行计算
picoArray
功放线性化
数字信号处理器
一种多处理器并行计算机系统的设计
共享存储器网络
主处理器
心跳
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向FT1000微处理器的STREAM并行计算与优化
来源期刊 计算机工程与科学 学科 工学
关键词 多线程微处理器 STREAM测试程序 性能优化
年,卷(期) 2014,(12) 所属期刊栏目 高性能计算专辑
研究方向 页码范围 2267-2271
页数 5页 分类号 TP301.6
字数 3959字 语种 中文
DOI 10.3969/j.issn.1007-130X.2014.12.005
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 胡庆丰 国防科学技术大学并行与分布处理重点实验室 14 83 5.0 8.0
2 刘杰 国防科学技术大学并行与分布处理重点实验室 28 135 7.0 11.0
3 蒋杰 国防科学技术大学并行与分布处理重点实验室 19 436 8.0 19.0
4 迟利华 国防科学技术大学并行与分布处理重点实验室 14 116 5.0 10.0
5 甘新标 国防科学技术大学并行与分布处理重点实验室 4 54 2.0 4.0
6 晏益慧 国防科学技术大学并行与分布处理重点实验室 2 13 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (4)
节点文献
引证文献  (2)
同被引文献  (7)
二级引证文献  (1)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
多线程微处理器
STREAM测试程序
性能优化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
总被引数(次)
59030
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导