基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
向量化算法映射是向量处理器的难点问题。提出一种高效的支持原位计算的三角矩阵乘法向量化方法:将 L1D 配置为 SRAM模式,用双缓冲的乒乓方式平滑多级存储结构的数据传输,使得内核的计算与 DMA 数据搬移完全重叠,让内核始终以峰值速度运行,从而取得最佳的计算效率;将不规则的三角矩阵乘法计算均衡分布到各个向量处理单元,充分开发向量处理器的多级并行性;将结果矩阵保存在乘数矩阵中,实现原位计算,节省了存储空间。实验结果表明,提出的向量化方法使三角矩阵乘法性能达到1053.7GFLOPS,效率为91.47%。
推荐文章
一种实现平衡三进制向量矩阵乘法的光学方法
向量矩阵乘法
光学向量矩阵乘法
光学处理器
三值逻辑
光学向量矩阵乘法研究
光学向量矩阵乘法
向量矩阵乘法
三值光计算机
三值逻辑光学处理器
三角旋回优化支持向量机预测出清价及价格钉
市场出清价
价格钉
预测
三角旋回算法
支持向量机
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 支持原位计算的高效三角矩阵乘法向量化方法
来源期刊 国防科技大学学报 学科 工学
关键词 三角矩阵乘法 原位计算 向量化 向量处理器
年,卷(期) 2014,(6) 所属期刊栏目 计算机科学与技术?物理学
研究方向 页码范围 7-11,47
页数 6页 分类号 TP391.4
字数 4581字 语种 中文
DOI 10.11887/j.cn.201406002
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈磊 国防科技大学计算机学院 47 804 12.0 27.0
2 刘仲 国防科技大学计算机学院 11 64 4.0 7.0
3 田希 国防科技大学计算机学院 3 12 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (10)
参考文献  (2)
节点文献
引证文献  (4)
同被引文献  (9)
二级引证文献  (4)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(3)
  • 引证文献(3)
  • 二级引证文献(0)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
三角矩阵乘法
原位计算
向量化
向量处理器
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
国防科技大学学报
双月刊
1001-2486
43-1067/T
大16开
湖南省长沙市开福区德雅路109号
42-98
1956
chi
出版文献量(篇)
3593
总下载数(次)
5
总被引数(次)
31889
论文1v1指导