基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着处理器和存储器速度差距的不断拉大,访存指令尤其是频繁cache miss的指令成为影响性能的重要瓶颈.编译器由于无法得知访存指令动态执行的拍数,一般假定这些指令的延迟为cache命中或者cache miss的延迟,所以并不准确.我们引入cache profiling技术来收集访存指令运行时的cache miss或者命中的信息,利用这些信息来计算访存的延迟.乱序机器上硬件的指令调度对于发射窗口内的指令能进行很好的动态调度,编译器则对更长的范围内的指令调度更有优势.在reorder buffer中cache miss一旦发生,容易引起reorder buffer满,导致流水线阻塞.调度容易cache miss的指令,使其并行执行,从而隐藏cache miss的长延迟,就可以提高程序性能.因此,我们针对load指令,一方面修改频繁miss的指令的延迟,一方面修改调度策略,提高存储级并行度.实验证明,我们的调度对于bzip2有高达4.8%的提升,art有4%的提升,整体平均提高1.5%.
推荐文章
静态超标量MCU-DSP内核的Load先行访存调度
微控制器(MCU)
数字信号处理器(DSP)
Load先行
静态超标量
动态调度
一种基于GCC的VLIW编译器指令调度算法
指令调度
指令级并行(ILP)
VLIW
DAG图
基于 LLV M的指令并行调度与实现
LLVM
编译器
指令并行
指令调度
同时多线程处理器的指令调度器设计
多核处理器
同时多线程
动态调度
图形处理算法
指令级并行
线程级并行
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 乱序执行机器上的load指令调度
来源期刊 计算机科学 学科 工学
关键词 指令调度 cache profiling 存储级并行
年,卷(期) 2007,(11) 所属期刊栏目 软件工程
研究方向 页码范围 298-300,311
页数 4页 分类号 TP3
字数 3394字 语种 中文
DOI 10.3969/j.issn.1002-137X.2007.11.079
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张兆庆 中国科学院计算技术研究所系统结构重点实验室 64 430 11.0 17.0
2 冯晓兵 中国科学院计算技术研究所系统结构重点实验室 42 186 7.0 11.0
3 周谦 中国科学院计算技术研究所系统结构重点实验室 13 48 3.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
2007(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2008(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
指令调度
cache profiling
存储级并行
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学
月刊
1002-137X
50-1075/TP
大16开
重庆市渝北区洪湖西路18号
78-68
1974
chi
出版文献量(篇)
18527
总下载数(次)
68
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导