基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在SIMD处理器上映射矩阵运算时会带来大量的数据重排操作从而降低系统性能.本文提出定制化的多粒度矩阵寄存器文件(MMRF)以消除数据重排操作.MMRF支持多粒度的并行行访问和列访问,从而提升矩阵运算的性能.MMRF可以被动态配置为不同的并行访问模式,在不同模式下一个或多个子矩阵可以被并行处理.实验结果显示,同传统的向量寄存器文件(VRF)和矩阵寄存器文件(MRF)相比,MMRF可分别带来2.21倍和1.6倍的平均性能提升,面积分别增加14.3%和3.7%,功耗分别增加14.6%和2.2%.同TMS320C64x+处理器相比,基于SIMD技术的FT-Matrix处理器在引入MMRF后可以得到5.65倍到7.71倍的性能提升.通过层次化的全定制设计技术,MMRF的面积和关键路径分别减少17.9%和39.1%.
推荐文章
数字信号处理器中10端口高速寄存器文件设计
数字信号处理器
寄存器文件
CMOS
灵敏运放
数字信号处理器分布式寄存器的写回设计
分布式寄存器
写回
超长指令字
流水线
高速5端口寄存器文件的设计与实现
寄存器文件
灵敏放大器
多端口
旁路输出
基于FPGA的移位寄存器流水线结构FFT处理器设计与实现
FFT处理器
流水线结构
FPGA
Quartus Ⅱ
Verilog HDL
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于SIMD处理器的全定制多粒度矩阵寄存器文件
来源期刊 国防科技大学学报 学科 工学
关键词 SIMD 矩阵运算 多粒度 矩阵寄存器文件
年,卷(期) 2013,(4) 所属期刊栏目 计算机科学与技术·控制科学与工程·管理科学与工程
研究方向 页码范围 156-160
页数 5页 分类号 TP316
字数 3675字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈书明 国防科技大学计算机学院 65 467 11.0 18.0
2 陈海燕 国防科技大学计算机学院 17 39 4.0 5.0
3 张凯 国防科技大学计算机学院 3 25 2.0 3.0
4 李振涛 国防科技大学计算机学院 9 20 3.0 4.0
5 王耀华 国防科技大学计算机学院 4 20 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
SIMD
矩阵运算
多粒度
矩阵寄存器文件
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
国防科技大学学报
双月刊
1001-2486
43-1067/T
大16开
湖南省长沙市开福区德雅路109号
42-98
1956
chi
出版文献量(篇)
3593
总下载数(次)
5
总被引数(次)
31889
论文1v1指导