原文服务方: 科技与创新       
摘要:
C870流处理器采用三级存储层次、三级访问模式.其流处理结构特别适合于数据并行性好、全局数据重用较少的计算密集型应用.根据C870流处理器的软硬件结构,针对高度的浮点密集运算、海量数据元素并行计算的问题,本文提出使用计算来隐藏内存访问的延迟,从而提高存储系统的带宽.并首次提出了在C870流处理器上的使用芯片上共享内存(On-chip Shared Memory)的大型矩阵的计算方法,并用5000*5000和2000*2000的方形矩阵进行优化实验,实验结果证明了使用芯片上共享内存优化计算,可以使浮点性能提高7倍多.
推荐文章
μC/OS-Ⅱ在ARM处理器上的移植
ARM处理器
μC/OS-Ⅱ操作系统
基于微处理器的大数及其计算方法研究
二进制数
微处理器
四则运算
浮点数
采用边界流响应矩阵的组件等效计算方法研究
边界流响应矩阵
组件等效
本征值问题
固定源问题
C5G7基准题
在VLIW处理器上实现视频图像的运动估计算法的方法
运动估计
VLIW
SIMD
数据准备
图像重组
图像数据复用
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 C870流处理器上的大型矩阵计算方法
来源期刊 科技与创新 学科
关键词 C870 处理器 矩阵计算 芯片上共享内存
年,卷(期) 2008,(24) 所属期刊栏目 图像处理
研究方向 页码范围 303-305
页数 3页 分类号 TP302.7
字数 语种 中文
DOI 10.3969/j.issn.1008-0570.2008.24.123
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈庆奎 149 769 14.0 22.0
2 贾丹 4 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (6)
参考文献  (2)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
C870
处理器
矩阵计算
芯片上共享内存
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
科技与创新
半月刊
2095-6835
14-1369/N
大16开
2014-01-01
chi
出版文献量(篇)
41653
总下载数(次)
0
总被引数(次)
202805
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导