FPGA-DSP瞄准目标:用得起的DSP性能

来源 :电子产品世界 | 被引量 : 0次 | 上传用户:jwliangbo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  FPGA-DSP性能揭秘
  
  
  在无线基站等高性能DSP应用中,考虑将FPGA用作处理引擎者日益增多。在这些应用中,FPGA既可与DSP处理器一争高下,亦可与之比翼齐飞。
  有了更多选择,就意味着系统设计者有必要了解高端FPGA的信号处理性能,其中既包括FPGA之间的性能对比,也包括与高端DSP处理器的性能对比。遗憾的是,最常用的性能数字非但有失可靠、含混不清,而且常常是矛盾百出。
  例如,因为DSP应用常常在很大程度上依赖乘法累加(MAC)运算,所以DSP处理器和FPGA供应商有时用每秒MAC运算次数的峰值作为简单度量来比较数字信号处理性能。但MAC流量对于FPGA和DSP二者都同样是糟糕的性能预测值。我们来分析几个原因。
  
  简单度量显露缺憾
  FPGA的MAC性能数字常常假设硬连线DSP器件是在其可能的最高时钟速率下工作。但实际上,典型FPGA设计的工作速率都比较低。另外,使用硬连线器件并非在FPGA上执行MAC运算的唯一方法,您可以使用可编程逻辑资源和分布式算法获得更大的MAC流量。与仅使用硬连线器件相比,这种方法可产生更高的MAC流量。
  另一个考虑因素是,除了MAC运算,典型的DSP应用还依赖许多其他运算方法。例如,Viterbi解码就是在完全不使用MAC的电信应用中使用的一种关键DSP算法。
  另一种评价信号处理性能的方法是使用常用的DSP函数,如FIR滤波器函数。但此方法也有缺点。其中一个问题是,每个供应商在使用这样的函数时,实现方法往往不同,他们可能使用不同的数据宽度、不同的算法或不同的实现参数(如延时参数)。这意味着不同供应商的结果通常是不可比的。
  再者,较小的核函数通常对FPGA基准测试无效,因为在完整FPGA应用中实现函数的方法常常与单独实现该函数的方法大相径庭。相反,对于处理器来说,这些小型基准测试往往颇能预测DSP应用的总体性能。最后,处理器或FPGA供应商实施的基准测试常常缺乏独立验证,这使工程师们很难在器件之间做出自信的比较。
  
  独立基准测试填补空白
  最近,BDTI使用BDTI通讯基准测试(0FDM)对若干新型高性能FleA和DSP处理器进行了评价,此报告结论在DSP系统设计者中引起了极大关注。该报告包括两套基准测试结果:高容量结果(为支持每芯片最大通道数而优化)和低成本结果(针对每通道最低成本而优化)。为一个Xilinx Virtex-4 SX25 FPGA和一个典型高性能DSP处理器的规范化低成本结果。
  此基准测试结果显示,Virtex-4 SX25器件的成本效益比典型的高性能DSP处理器高出一个数量级。
  当然,仅基准测试结果还不足以回答是否在新系统设计中使用FPGA或选择哪种FPGA的问题。设计者必须了解处理引擎的选择对开发流程、实现难度和系统设计有何影响。
  
  Sparten-DSP:瞄准用得起的DSP性能
  
  在DSP市场中,并不总是那些最快的、最便宜的或最节能的处理器才能胜出:对于每个范畴都能应付自如的平台,才能稳操胜券。在高密度Virtex系列之外,Xilinx今年4月第一次推出了基于低成本系列的Spartan-3A DSP。Spartan-3A DSP实现了32GMAC/s、高达2200Mbps的内存带宽和更小的体积。对于以下种种应用来说,充分满足了其要求:单通道微微蜂窝无线基站中的数字前端(DFE)和基带解决方案;军用移动软件定义无线电(SDR);超声波系统;驾驶员助手/媒体系统;高清晰度视频;智能IP摄像机。
  Spartan-3A DSP不仅拥有高达53712个逻辑单元、2268Kb的Block RAM、373 Kb的分布式RAM、519只I/O引脚、安全专用DeviceDNA、新开发的休眠/悬挂式电源管理功能,提供了足够的集成空间,使得价位/性能/功耗的比率降至更低。除此之外,还有基于FPGA的DSP解决方案所固有的优点:通过设计上的灵活性和更快的上市时间实现低风险。
  
  针对DSP而优化的Spartan FPGA
  Spartan一3A DSP的核心是XtremeDSPDSP48 Slice的一个修订版本-DSP48A。DSP48Slice最初是随着Virtex-4 FPGA的发布而推出的,它具有“面向应用的组合模块”(ASMBL)架构,能提供Virtex DSP器件中的DSP功能。这些XtremeDSP Slice使得设计者们能够针对复杂的挑战实施解决方案,例如:数百个IF(中频)到基带下变频转换通道,用于3G传输频谱系统的128倍芯片速率处理和高清晰度H.264及MPEG-4编码/解码算法。
  这种DSP48 Slice支持许多独立功能,包括:乘法器、MAC、乘法器带加法器、3输入加法器、桶式移位器、宽总线多路复用器、量级比较器或宽计数器。这种架构也支持将多个DSP48 Slice连在一起形成宽数学函数、DSP过滤器和复杂算术函数,而无需使用总体FPGA架构,从而降低了功耗,同时达到高的性能和芯片使用率。
  为降低成本,DSP48A Slice去掉了舍入模式、17位移位器和3输入加法器。如有需要,您可以在FPGA架构中实现这些功能。DSP48A Slice还有两项额外增强功能:一个独立控制的C-port和一个预加器。独立的C-port在实施DSP算法时提供了更高的灵活性。预加器则提高了普通DSP过滤器和FFT的密度。特别值得一提的是,预加器可以用来减少所需DSP48ASlice的数量:对对称FIR过滤器来说,可减少50%;对FFT算法,可减少25%。在Spartan-3ADSP平台上,优化过的DSP48A Slice在最慢的速度级别上也达到了250MHz的运行频率。
  
  应用效果
  
  Spartan-3ADSP器件所带来的效率,从下例中可见一斑:在智能IP摄像机应用中,一个单独的XC3SDl800A器件可以代替两个25美元的DSP处理器,它容纳了处理过程中的整个视频管道部分。25美元成本直接降低不说,用户还可以将其余控制功能置于一个更小、更经济的DSP处理器中,于是材料费又可降低10美元。再加上功耗、占用空间和材料单(BOM)上的节省,Spartan-DSP对盈利性、可靠性和产品移植都有着直接而积极的影响。
  类似的对多流视频服务器的研究表明:一个使用六个25美元DSP处理器的设计可缩减到使用三个25美元Spartan-3A DSP器件,成本立刻降低几乎一半。
  在有些场合,比如SDR在移动防卫通讯方面的应用,Spartan-3A DSP可作为离散DSP的可重新配置协处理器使用,同时还可消除对支持多波形的双重电路的需求。
  
  设计工具:XtremeDSP解决方案
  XtremeDSP是让FPGA-DSP能供三类特定的设计者群体使用:系统设计者、DSPI程师和FPGA/硬件工程师。每一个群体都代表着一系列的特殊责任(和偏好)。因此,XtremeDSP的关键是设计工具在多大程度上能适应所有这三个群体。自从XtremeDSP计划启动以来,诸如SystemGenemtor和AccelDSP等工具已有长足发展,能提供系统建模、算法开发和探索、测试平台的自动生成、设计验证和调试以及HDL的生成和仿真。无论您更偏好于使用VHDL、Verilog、C/C++、MATLAB、Simulink、HDL还是其任意组合,XlremeDSP工具都能提供快速、高效的手段,让您自如地驾驭FPGA的强大功能。
其他文献
数字控制相对于传统模拟方法的优势有很多,远远超过了数字控制组件参数变化带来的相关问题(图1显示了FPGA控制的降压转换器)。相对于传统方法而言,FPGA能够以更快的频率运行,并能更迅速地对瞬变电流负荷做出积极响应(在某些应用中可能减少对多相转换器的需求)。控制算法可通过DSP和控制理论技术加以调节,以确保设计实施的高效性——例如,较轻负荷下进行脉冲跳跃以及持续和断续模式之间的切换等。滤波等DSP技
期刊
近日,Synopsys公司董事长兼首席执行官Aart de Geus博士接受了《电子产品世界》的访问。当前EDA业有五大主题:实现、制造、验证、系统设计和IP。  2009-2012年以来,Synopsys进行了十多次并购,包括去年底收购Magma。原因是意识到只有系统复杂程度达到某一个量时才会质变,才会真正改变设计的环境。例如,一个SoC所碰到的问题可能是制造的问题,也可能是实现、验证或系统级软
期刊
恩智浦(NXP)半导体执行董事、总裁兼首席执行官Rick Clemmer不久前接受了本刊的采访,称其已经实现了战略转型,专注四大领域,并支持中国实现从“中国制造”到“中国设计”的跨越,专注ARM MCU的策略等。  NXP从2011年第4季度到2012年第一季度增长了7%,而很多半导体同行却下降了,NXP的增长来自两方面,一是安全技术(特别是在ID)实现了两位数增长。二是之前与一些车厂进行设计项目
期刊
日前,德州仪器(TI)与清华大学宣布共同组建“未来智能机器人”兴趣团队,从而为未来智能型机器人开发、多智能体协同技术研究感兴趣的学生提供学习、交流、研究、实践和创新的平台。  TI 大中华区总经理、中国运营总裁谢兵先生表示,“自1958年TI的工程师Jack Kilby发明了集成电路,基于集成电路的各种技术和产品的创新已经完全改变了我们的学习、工作、娱乐的方式,并渗透到日常生活的每一个角落。清华大
期刊
自1970年发明MOS工艺及73年推出CMOS工艺以来,至今还没有发现可替代它的工艺,足见CMOS工艺的经济合理性。因此,至今硅基材料的应用仍在继续延伸。然而,在晶体管工艺制造中采用二氧化硅作为栅极材料,实质上已逼近极限。如65纳米工艺时,二氧化硅栅极的厚度已降低至1.2纳米,约5个硅原子层厚度,如果再继续缩小,将导致漏电及功耗急剧上升。    晶体管工艺技术的又一个里程碑    Intel共同创
期刊
摘要:本文介绍了同步采样ADC在电网监测中的应用,并对构建电力线测量系统时所要考虑的问题进行了讨论。  关键词: ADC;电力线监测;放大器;数字隔离器    前沿    电力工业的迅速扩展,在全球范围内引发了加强现有传输和配电网络以及建设新变电站的需求。微处理器技术方面的进展以及支持人员的人力成本的上升,已经成为电力公司设计新的、采用高精度集成化自动控制系统的自动化高压变电站的关键性推动因素。
期刊
王典洪 乔 伟 谢利芳  摘要:提出了一个基于WinCE操作系统的通用USB数控键盘设计。实现了键盘与主机之间快速灵活的数据通信。  关键词: 嵌入式;USB;数控键盘;WinCE    引言    随着网络时代的到来,机械制造行业也面临着如何适应网络化制造的问题。于是将计算机技术、网络技术和传统的控制技术相结合,以嵌入式系统为主的数控系统正日益成为机械制造领域的热点。对于一个具体的数控系统,在
期刊
摘要:本文介绍了如何利用外置ADC取代微控制器内部所集成的ADC以及设计时需要考虑的注意事项。  关键词: ADC;微控制器;增益放大器;传感器阻抗    当今的电子产品总是希望尺寸越小越好。从占据整个房间的服务器系统到能方便地装进衣服口袋的消费电子产品,设计师们不断寻求实现最小的外形尺寸,在更小的空间中实现更多的功能。能够让完整的解决方案比同类方案小10%到20%的设计师有更大的机会赢得设计订
期刊
摘要:绍了一种SDRAM通用控制器的FPGA模块化解决方案。  关键词: SDRAM控制器;FPGA;VHDL;状态机;仲裁机制    引言    同步动态随机存储器(sDRAM),在同一个CPU时钟周期内即可完成数据的访问和刷新,其数据传输速度远远大于传统的数据存储器(DRAM),被广泛的应用于高速数据传输系统中。基于FPGA的SDRAM控制器,以其可靠性高、可移植性强、易于集成的特点,已逐渐
期刊
近日,第八届NI高校教师交流会(Professor Day 2012)在哈尔滨举办,来自全国22个省/直辖市、110所高校的244余名教师受邀参加。NI的高校教师交流会一直致力于用NI先进的科技与全新的理念,为高校教师提供分享工程教育的创新理念与前沿技术的交流平台。  今年的高校教师交流会以“图形化系统设计助力创新型工程教学与高效率院校科研”为主题,包括创新性教学、高效率科研及未来工程师专题在内举
期刊