基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
Xilinx和Intel生产的许多先进现场可编程门阵列(Field Programmable Gate Array,FPGA)中,通常采用具有较高的固定位宽乘法器的数字信号处理(Digital Signal Processing,DSP)模块,它们往往不能高效支持低位宽乘累加(Multiply Accumulate,MAC)运算.为解决这一问题,本文提出一种支持低位宽乘累加的新DSP块,在实现Xilinx DSP48E1功能的基础上,通过数据移位、乘法器拆分与后置加法器单指令流多数据流(Single Instruction MultipleData,SIMD)功能的配合,可以并行实现2个8-bit乘累加或2对共享乘数的4-bit乘累加,同时留出足够的保护位防止溢出.其中,乘法器拆分可减少部分积压缩时间,而新功能提高了DSP块利用率,从而使计算多个低位宽乘累加时所需DSP块数目变少,总使用面积减少.实验结果表明:与实现DSP48E1功能的基础DSP相比,新DSP计算速度提升了9%,当实现2倍数目的8-bit乘累加和实现4倍数目的共享乘数的4-bit乘累加时,DSP块使用总面积均减少40.8%,而单个DSP块面积增加18%.与其他文献中支持低位宽乘累加的DSP块相比,新DSP块对于4-bit乘累加的支持进一步增强,且改进方法更适应Xilinx DSP块的功能特点.
推荐文章
一种高速DSP中延迟优化的乘累加单元的设计与实现
乘累加单元
改进的波兹编码
部分积
修整向量
Wallace树压缩器
进位保留加法器
进位传播加法器
浮点乘累加处理单元的FPGA实现
乘累加
浮点
稀疏矩阵向量乘
FPGA
新型的DSP处理器高速低功耗多功能乘累加单元
乘累加单元
异步流水线
部分积字校正
三维压缩法
一种支持高效加法的FPGA嵌入式DSP IP设计
现场可编程逻辑门阵列(FPGA)
嵌入式DSP
加法运算
乘法旁路器
符号位扩展
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 FPGA中适用于低位宽乘累加的DSP块
来源期刊 复旦学报(自然科学版) 学科 工学
关键词 现场可编程门阵列 数字信号处理 乘累加 低位宽
年,卷(期) 2020,(5) 所属期刊栏目
研究方向 页码范围 575-584
页数 10页 分类号 TN403
字数 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王健 145 835 15.0 20.0
2 来金梅 68 322 9.0 13.0
3 樊迪 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
现场可编程门阵列
数字信号处理
乘累加
低位宽
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
复旦学报(自然科学版)
双月刊
0427-7104
31-1330/N
16开
上海市邯郸路220号
4-193
1955
chi
出版文献量(篇)
2978
总下载数(次)
5
总被引数(次)
22578
论文1v1指导