ＦＰＧＡ功耗管理与优化的构成

来源 :电子产品世界 | 被引量 : 0次 | 上传用户：n19851020

【摘要】

：

【作者】

：

Ａｌｔｅｒａ公司供稿

【出处】

：

电子产品世界

【发表日期】

：

2006年24期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　随着制造工艺水平的提升，FPGA密度和复杂程度不断提高，功耗也在越来越多的设计中成了一个必须要考虑的要素。如何在器件结构和工艺中对功耗进行优化，如何在设计前期尽可能准确的估计功耗，如何在设计中运用合理的设计方法和器件结构降低功耗，综合工具如何针对功耗进行优化，这些都对FPGA生产厂家、EDA工具提供商和设计工程师提出了新的挑战。
　　
　　FPGA功耗的构成
　　
　　由图1我们可以看到功耗基本上可以分成3部分：管脚触发器翻转的动态功耗，芯片内部触发器翻转的动态功耗和芯片静态功耗。在这三部分当中静态功耗是由芯片本身的生产工艺决定，不会随着设计和温度的变化而变化；内部和管脚的动态功耗来源于在高低电平翻转过程中对电容的充电，并且这一部分可以由如下公式进行计算：
　　

　　P＝kCV²f
　　由此公式我们可以看到影响动态功耗的因素包括：介质介电常数k，电容包括负载电容以及各种寄生电容c，电压V和触发器翻转频率f
　　
　　基于90纳米工艺的功耗优化
　　
　　如今半导体厂商们使用了很多种技术去降低功耗，比如使用Low-k电介质材料可以降低大约10％的10及内部晶体管的功耗，从图1中，我们可以看到10及内部晶体管的功耗占据了芯片总功耗的大部分，由此可见，采用Low—k电介质降低的10％的功耗是非常可观的；另外还有一些技术既可以降低动态功耗，也可以降低静态功耗，比如调整晶体管的阂值电压，当然这种调整是基于功耗与性能间的平衡，为每个晶体管设置阈值电压。又比如使用三层氧化物技术降低静态功耗，尤其在可配置RAM中比较明显。
　　下面主要以ALTERA 90nm工艺的StratixlI器件为例介绍半导体制造工程中的技术：
　　
　　FPGA功耗的预测
　　
　　

　　在FPGA上板验证之前就对其功耗进行准确预测对系统的供电和散热设计的重要性自不言而喻。针对这点，Altera不仅提供了单独的EPE(EarlyPower Estimator)工具可以针对FPGA在不同的环境温度，散热片大小，风速等各种条件下的功耗进行评估，也在QuartuslI软件中集成了Power Play这一功耗分析工具。并且在Power Play中可以导入后仿真时的VCD文件，从中提取出各个触发器的翻转率，从而使分析结果更加接近于实际情况。
　　
　　综合工具对功耗的影响
　　
　　同样的RTL代码，使用不同的工具或者同一工具的不同选项综合出的逻辑结构不尽相同，这些也都会影响的整个器件的最终功耗。一个典型的例子就是RAM结构的编译。FPGA内部的RAM是固定大小的块RAM，如果要实现一个超出单个块RAM大小的RAM时往往需要将多个块RAM拼凑而成。比如在Cyclone器件中实现一个4K'4大小的RAM，需要4个M4K块RAM来实现；但是这个实现又有着两种不同的结构(见图2)。
　　如图2A，采用了拼深度的办法，将高位地址线Addr[10：11]作为片选信号和数据输出Mux的选择信号，虽然额外多了一个译码器和一个Mux，但是确保了每次读写有且仅有一个M4K在工作。再看图2B，采用了拼数据位宽的办法，虽然省掉了额外的译码器和Mux，但是每次读写时每一个M4K都在工作。显然，采用图2A的方式多用了资源，但是降低了功耗；采用图2B的方式节省了资源，但是缺浪费了功耗。
　　针对综合工具对功耗的影响，QuartusII从5．1开始在综合设置上除了面积优先和速度优先之外增加了一个功耗优化选项，当选择功耗优先时，QuartusII工具会自动针对当前的RTL设计选择一个功耗最优的结构。
　　
　　代码风格对动态功耗的影响
　　
　　如图l所示，动态功耗占用了整个芯片功耗的大部分，而动态功耗与芯片内部的资源密切相关。如图3所示在在StratixlI和CyclonelI器件中的动态功耗源的分布情况，通过对功耗源分布的理解有助于我们在代码设计阶段就考虑到如何降低功耗。图3中所有的设计都是在200MHz频率下使用多种逻辑资源产生的功耗。
　　

　　可以看到在StratixII和CycloneII器件中大部分的功耗都是消耗在布线资源中，其余的分布在逻辑、时钟和内嵌RAM中。
　　
　　时钟功耗管理
　　
　　时钟由于具有高的翻转率和很长的分布路径，在动态功耗中占据了较大的比例，从图3中可以看出在StratixlI中平均有7％的功耗是由全局时钟布线带来的，而在CyclonelI中则高达15％。实际中与时钟有关的功耗可能更高，因为在逻辑、RAM和DSP模块内部的局部时钟也会消耗大量功耗。
　　时钟布线功率可以通过QuartusII软件自动优化，这里我们主要介绍在设计中利用Clock Control模块降低功耗的方法。Clock control模块是一个时钟驱动器，它可以由设计者动态的使能或关断时钟网络，或者在多个时钟源之间切换。其结构如图4所示：
　　用户可以利用ena信号动态关闭指定的时钟网络，使得由其驱动的所有逻辑单元停止翻转，从而起到降低整个芯片功耗的作用。
　　另一种时钟功耗是LAB内部驱动触发器的时钟所产生。如图3所示，在StratixII器件中每个LAB中的Clock和Clock enable都物理上连接在一起的，比如：使用labclk1信号的同时labclkenal信号也是使能的。因此，为了降低LAB-wide的时钟功耗，又不用关闭整个时钟树的话，就可以考虑用Clock enable信号控制内部触发器的翻转。参考的HDL代码如表2所示。
　　此处的时钟门控逻辑将会被QuartuslI软件自动的转为LAB-level的clock enable信号。从而减少时钟树分支的数量，降低时钟功耗。
　　

　　PipeLining和Retiming对功耗的影响
　　
　　带有大量毛刺的设计将会消耗更多的功耗，因为毛刺本身具有高翻转率。毛刺的产生是由于输入信号传输路径的差异所带来的，它使得组合逻辑的输出产生了不确定的同时也是不必要的电平翻转。设计中如果使用了大量的组合逻辑将会使毛刺传播的更广泛，继而带来大量的功耗。使用Pipeling结构可以有效的阻止毛刺的传播，在复杂的组合逻辑中使用触发器隔离的Pipeling结构，可将组合逻辑的复杂度降低，也同时将毛刺可传播的范围也缩小了。Retiming功能同样可以调整组合逻辑的复杂度。
　　下面我们通过一个实际例子来看，实验用到的三个例子的算法都是依赖于异或门功能，具体的资源使用情况如表3。使用PowerPlay功耗分析工具估算功耗，StratixII器件动态功耗的最大降幅达到了31％。
　　
　　下一代降低功耗的工艺展望
　　
　　众所周知，功耗随着器件密度和时钟频率的提升而加倍的增加，降低功耗将对芯片工艺技术和软件优化算法等提出了更高的要求，目前工业界领先的65nm降低功耗的技术如表4所示，在即将推出的6 5nm的下一代StratixIII产品中，将采用这些技术降低功耗。

其他文献

探秘Ｉｎｔｅｌ８０核处理器

如今多核已不算是什么新鲜的词汇，甚至很多人对多核技术感到厌烦——因为已经看得多了。而在各种文献和媒体中，常常会看到关于多核处理器缺乏相应的软件的评论与报道，这些评论与报道来自专家、媒体甚至是芯片设计者本身。　　多核芯片往往如潮水般来去匆匆，过去人们为多核芯片感到兴奋与激动，点燃着瞬间激情，可是又像黑夜中的烟花那样空留绚丽的色彩后就归于寂静。　　这次却不同了，在今年的ISSCC(国际固态电子电路会议

期刊

用ＤＣ／ＤＣ转换器最大化便携媒体播放器电源效率

如果你问十几岁的青少年最希望他们的MP3是什么样的，他们的回答总是相同的一他们希望自己的MP3具有很酷的外形以及优异的音质，另外他们还希望电池工作时间越长越好。　　和大多数的便携电子产品类似，便携媒体播放器采用2．8V-4．2V锂离子电池或聚合物锂电池来供电。在这些设备中延长电池寿命以及最小化电能耗费的关键是在整个系统中最大化电源效率。为实现这个目标，便携媒体播放器的设计者必须首先关注两个子系统一

期刊

ＩＤＴ　１０Ｇ串行缓冲器满足无线基站高数据吞吐量需求

IDT公司推出业界首个基于串行RapidlO的10G串行缓冲器存储解决方案。据介绍，该缓冲器与IDT先前推出的预处理交换芯片(PPs)组成的无线芯片组解决方案可提供一种优化的互连，使DSP性能提高20％，从而为终端用户提供包括移动视频等具有成本效益的先进DSP密集无线服务。该无线芯片组可与任何供应商提供的信号处理器(DsP)和码片率处理器(cRP)共同使用，为蜂窝基带供应商提供完整的解决方案。　　

期刊

ＺｉｇＢｅｅ规范与系统设计需求剖析

无线技术在人们的生活中愈来愈重要，目前市场上的焦点技术包括Wi-Fi、3G/HSDPA、WiMAX、UWB、蓝牙等等，这些技术都与人们直接存取数据的应用有关，例如上网、下载影音文件或拨打电话。不过，有另一类无线应用也正在快速的发展中，此类应用与人们的使用虽不一定直接相关，但对生活的便利性也有相当大的帮助。　　这就是所谓的无线传感或控制网络，其应用领域非常广，只要是具有控制或传感功能的电子设备，在加

期刊

８０２．１１ｎ：速度、传输距离以及何时来临

最近所采纳的802．11n Wi-Fi标准有希望极大地提升无线网络的带宽和传输距离。新标准将提高性能10倍以及传输距离提高3倍，从而为家庭及办公客户开辟令人兴奋的新天地。对新一代吉比特以太网WAN路由器，DSL／宽带网关，PC／笔记本网卡，无线HDTV适配器，和IP机顶盒的关注正在快速增加。　　首先，相关芯片首先在今年春天进入市场。三个领军的网络IC开发商，Marvell Semiconducto

期刊

无按键时代即将到来

从手机到汽车音响面版的传统用户界面设计，都包含了没有区别的笨拙的旋钮、拨号盘和按键。一直以来，各个消费电子产品公司的工业设计和产品营销部门都在寻找使他们的产品区别于市场上其他产品的方法，以便获得竞争优势。Cypress的电容感应解决方案迎接了这一挑战并为差异化的设计提供了无限的可能性。　　　　电容感应是利用人体本身的电容或者导电铁笔来产生接触界面，以替代传统的机械控制。这一技术有很多优势：工业设计

期刊

利用ＣＡＮ－ｂｕｓ实现多台ＰＬＣ之间的远程配置与实时通信

摘要：通过现场总线CAN-bus，可以将多达数十台的中，小型PLC联网，构成一个智能PLC网络；同时，主控制器可以与指定的远程PLC实现远程配置、控制通信，以及实现组态环境中的应用。　　关键词：PLC；CAN-bus；CAN232MB转换器；PC-CAN接口卡　　　　PLC特点与PLC网络　　　　可编程控制器(PLC)是一种数字控制专用电子计算机，它使用了可修改的程序存储器储存指令，执行诸如逻辑、

期刊

ＦＰＧＡ的ＤＳＰ性能揭秘

“今天，FPGA越来越多地应用在多种DSP中。我们预计这一趋势在未来几年会更加明显。”美国调查机构Berkeley设计技术公司做了上述预测。以Xilinx和Altera为主的两大FPGA厂商多年前就涉足了DSP应用领域，近一、两年，随着3G通信、视频成像等领域的发展，FPGA for DSP(FPGA的DSP)再次成为了热点。　　为什么会用FPGA做DSP?Xilinx中国区运营总经理吴晓东从DS

期刊

ＣＭＯＳ两级运算放大器调零电路性能分析

摘要：本文以基本的二级CMOS运算放大器为基础，主要从结构改进方面入手，讨论了如何提高CMOS运算放大器速度性能并且对电路的容差进行了较为详细的分析。近年来随着CMOS工艺的发展，CMOS运放已经能够实现高增益、高速度、低噪声等高性能要求。本文通过HSPICE和Candence工具在BSIM3V3模型AAl833C05工艺环境下的电路仿真分析了CMOS两级运算放大器调零电路性能。　　关键词：CMO

期刊

嵌入式系统键盘接口模块的ＦＰＧＡ实现

摘要：本文给出了嵌入式系统键盘接口模块的实现方案，并着重对键盘扫描与状态判决、键码输出、键盘命令接收与响应三部分的FPGA实现做了详细阐述。　　关键词：嵌入式系统；键盘；FPGA　　　　概述　　　　随着微电子和计算机技术和应用不断创新，军用通信装备或民用信息终端的通信功能和信号处理能力与日俱增，与此同时，不同的通信终端对于系统功能、实时性、可靠性、安全性及体积重量等方面有着不同的要求，这促使嵌入式

期刊

ＦＰＧＡ功耗管理与优化的构成

其他学术论文