论文部分内容阅读
经过英特尔广告“等、等灯、等灯”对CPU的不懈宣传,CPU现在成了人尽皆知的东西。它是计算机的“大脑”,负责计算机核心的控制和运算。然而到了GPU,知道的人就少了一半。现在又有了个新东西,它叫DPU。
GPU中文叫做图形处理器,和CPU一样也是一种处理器,它是显卡的核心,专门执行复杂数学和几何计算,这些运算将渲染出图形结果。有了GPU这样专业化的图形处理器,CPU就能执行更多其他任务。
至于DPU,严格意义上说它并不是一种新研制出来的处理器,而是由Tensilica公司推出的一种“可配置”处理器,是数字信号处理器(DSP)的定制版。
一位接受采访的半导体行业人士提醒说,DPU目前还没有被行业广泛接受,它只是Tensilica公司对自己的产品的定义。“它还没有成为一个单独的品类”。
可以先来认识一下“DSP”。与CPU大脑的角色相比,DSP的作用就是负责处理CPU分配下来的、将外界模拟信号转化为计算机所能理解的数字信号(众多0和1组成)的任务。在过去很多DSP通常都是通用型产品,由德州仪器、摩托罗拉等主流芯片厂商提供,被适用于各个领域,既包括音频,也包括视频领域。
比如手机通话降噪,它需要一个软件区分出话筒前人的声音和环境的噪音,也需要硬件芯片即DSP,来实时处理传进传出的数据。
DSP现在成了Tensilica公司的创新空间。这是一家总部位于美国加州的芯片设计公司,按照其官方数据,全球前10大半导体公司中,已经有7家使用了Tensilica提供的DSP方案,并且还有其他200多家公司使用了它的产品授权。Tensilica的芯片总出货量已经超过了20亿枚,安装在包括手机、数字电视、蓝光播放器、宽带机顶盒、数码摄像机和便携式媒体播放机等等终端设备上,这家公司也藉此成为世界最大的音频DSP处理解决方案提供商。
在这个移动时代,Tensilica发现了一件事:智能手机和数码相机中的脸部识别功能、智能电视中使用的体感手势控制、汽车驾驶辅助系统等等……在这些应用中需要更强大的数据处理器,特制的数据处理器能比通用的数据处理器性能更好、功耗更低。
一些高端手机会配置专门的GPU,这是得到市场公认的图像处理的解决方案。但在其它很多设备上GPU并不是一个必须的配置,因此大部分图像处理的工作可能仍然需要CPU来完成,占用CPU的资源。
处理数据量大的图像时,如果DSP在进行模拟-数字信号转化时效率不足—这是目前的通用DSP最常发生的问题之一,CPU就会负载更大,性能表现也会下降,比如运算速度减慢、功耗增加。Berkeley Design Technology公司总裁Jeff Bier解释说,在使用通用DSP芯片时,处理实时的视频数据一般需要“每秒数百亿次作业”,这对很多CPU来说是一个吃力的活,毕竟并不是每一种设备都会配备最高性能的CPU。
以手机摄像为例,目前主流手机通常支持800万像素的拍照,但很多时候画质还是无法令人满意。因为在将拍摄下来的照片、视频转化为CPU可以处理的数字信号时,传统的DSP已经出现瓶颈。而如果使用DPU,就可以解决这种问题,甚至可以将支持拍摄的像素数量提高好几倍,同时也让你的手机电池能撑更久的时间。
像素的不断增长已经对支撑它的软硬件提出了更高的要求。美国科幻作家大卫·布林甚至提出了摄像头的“摩尔定律”:每一到两年体积会减半,并且精度、移动能力以及数量都将翻倍。
为解决这种问题,Tensilica的方法是对CPU和DSP的架构进行优化设计,通过自己的专利设计,使运算资源在二者之间得以更好地被利用。为了区别于通用DSP,Tensilica将这种经过特别设计的、用于某个领域处理的DSP定义为“DPU”。
Tensilica公司亚太区总裁黄启弘介绍说:“可以通过增加或者减少通用DSP的内部指令集,达到‘个性化’DSP的目的,使DSP变成另外一个支持处理音频、图像数据的芯片,以应付越来越大的数据处理需求。”
对于图像处理,DPU的本质就在于经过重新设计,强化了DSP对图像数据的模拟-数字转化能力,使DSP能够更快、更多地将模拟信号转为数字信号,帮助提升CPU的处理速度。DSP的实时运行速度实际可以应付每秒数千万条的复杂指令,但过去的通用DSP往往无法充分利用这种能力。
2013年2月,Tensilica公司发布了一款针对视频领域的产品“IVP DPU”,用来帮助CPU处理更复杂的图像数据,它每秒可以帮助CPU处理一张相当于5000亿像素的图片所承载的数模转换的数据量。它采用了台积电的28纳米制程技术制造。据Tensilica公司介绍,IVP DPU核心占用面积不到0.5平方毫米,因此非常适合低成本应用。在理想条件下,它的图像处理性能比现有的、不使用GPU的方案最高可以快20倍。
黄启弘认为这个芯片可以用在那些需要处理复杂图像,同时不太方便或者没必要配置GPU的终端和场合。比如手机的高动态范围(HDR)拍照、脸部辨识、低光补偿和数码变焦功能,还有汽车智能导航和监测设备所需要的高速影像侦测、分析,以及智能电视的影像后处理、手势控制等。
目前已经有几家处理器设计公司计划利用这种“DPU”设计影像子系统,协助主处理器分担大量像素运算工作,更多解决方案可能会在2014年大量出现。
2013年3月,Tensilica被全球最大的电子设计技术、程序方案服务和设计服务供应商Cadence以3.8亿美元价格收购,后者看中的正是Tensilica在处理器设计方面的技术。
未来,对于消费者来说“更高级”意味着更快、更大,或者更清晰。它们永远没有尽头,而支持这些的一定需要更好的技术。对于Tensilica来说,它可能看准了一个方向,但也可能需要付出培育市场的代价。
GPU中文叫做图形处理器,和CPU一样也是一种处理器,它是显卡的核心,专门执行复杂数学和几何计算,这些运算将渲染出图形结果。有了GPU这样专业化的图形处理器,CPU就能执行更多其他任务。
至于DPU,严格意义上说它并不是一种新研制出来的处理器,而是由Tensilica公司推出的一种“可配置”处理器,是数字信号处理器(DSP)的定制版。
一位接受采访的半导体行业人士提醒说,DPU目前还没有被行业广泛接受,它只是Tensilica公司对自己的产品的定义。“它还没有成为一个单独的品类”。
可以先来认识一下“DSP”。与CPU大脑的角色相比,DSP的作用就是负责处理CPU分配下来的、将外界模拟信号转化为计算机所能理解的数字信号(众多0和1组成)的任务。在过去很多DSP通常都是通用型产品,由德州仪器、摩托罗拉等主流芯片厂商提供,被适用于各个领域,既包括音频,也包括视频领域。
比如手机通话降噪,它需要一个软件区分出话筒前人的声音和环境的噪音,也需要硬件芯片即DSP,来实时处理传进传出的数据。
DSP现在成了Tensilica公司的创新空间。这是一家总部位于美国加州的芯片设计公司,按照其官方数据,全球前10大半导体公司中,已经有7家使用了Tensilica提供的DSP方案,并且还有其他200多家公司使用了它的产品授权。Tensilica的芯片总出货量已经超过了20亿枚,安装在包括手机、数字电视、蓝光播放器、宽带机顶盒、数码摄像机和便携式媒体播放机等等终端设备上,这家公司也藉此成为世界最大的音频DSP处理解决方案提供商。
在这个移动时代,Tensilica发现了一件事:智能手机和数码相机中的脸部识别功能、智能电视中使用的体感手势控制、汽车驾驶辅助系统等等……在这些应用中需要更强大的数据处理器,特制的数据处理器能比通用的数据处理器性能更好、功耗更低。
一些高端手机会配置专门的GPU,这是得到市场公认的图像处理的解决方案。但在其它很多设备上GPU并不是一个必须的配置,因此大部分图像处理的工作可能仍然需要CPU来完成,占用CPU的资源。
处理数据量大的图像时,如果DSP在进行模拟-数字信号转化时效率不足—这是目前的通用DSP最常发生的问题之一,CPU就会负载更大,性能表现也会下降,比如运算速度减慢、功耗增加。Berkeley Design Technology公司总裁Jeff Bier解释说,在使用通用DSP芯片时,处理实时的视频数据一般需要“每秒数百亿次作业”,这对很多CPU来说是一个吃力的活,毕竟并不是每一种设备都会配备最高性能的CPU。
以手机摄像为例,目前主流手机通常支持800万像素的拍照,但很多时候画质还是无法令人满意。因为在将拍摄下来的照片、视频转化为CPU可以处理的数字信号时,传统的DSP已经出现瓶颈。而如果使用DPU,就可以解决这种问题,甚至可以将支持拍摄的像素数量提高好几倍,同时也让你的手机电池能撑更久的时间。
像素的不断增长已经对支撑它的软硬件提出了更高的要求。美国科幻作家大卫·布林甚至提出了摄像头的“摩尔定律”:每一到两年体积会减半,并且精度、移动能力以及数量都将翻倍。
为解决这种问题,Tensilica的方法是对CPU和DSP的架构进行优化设计,通过自己的专利设计,使运算资源在二者之间得以更好地被利用。为了区别于通用DSP,Tensilica将这种经过特别设计的、用于某个领域处理的DSP定义为“DPU”。
Tensilica公司亚太区总裁黄启弘介绍说:“可以通过增加或者减少通用DSP的内部指令集,达到‘个性化’DSP的目的,使DSP变成另外一个支持处理音频、图像数据的芯片,以应付越来越大的数据处理需求。”
对于图像处理,DPU的本质就在于经过重新设计,强化了DSP对图像数据的模拟-数字转化能力,使DSP能够更快、更多地将模拟信号转为数字信号,帮助提升CPU的处理速度。DSP的实时运行速度实际可以应付每秒数千万条的复杂指令,但过去的通用DSP往往无法充分利用这种能力。
2013年2月,Tensilica公司发布了一款针对视频领域的产品“IVP DPU”,用来帮助CPU处理更复杂的图像数据,它每秒可以帮助CPU处理一张相当于5000亿像素的图片所承载的数模转换的数据量。它采用了台积电的28纳米制程技术制造。据Tensilica公司介绍,IVP DPU核心占用面积不到0.5平方毫米,因此非常适合低成本应用。在理想条件下,它的图像处理性能比现有的、不使用GPU的方案最高可以快20倍。
黄启弘认为这个芯片可以用在那些需要处理复杂图像,同时不太方便或者没必要配置GPU的终端和场合。比如手机的高动态范围(HDR)拍照、脸部辨识、低光补偿和数码变焦功能,还有汽车智能导航和监测设备所需要的高速影像侦测、分析,以及智能电视的影像后处理、手势控制等。
目前已经有几家处理器设计公司计划利用这种“DPU”设计影像子系统,协助主处理器分担大量像素运算工作,更多解决方案可能会在2014年大量出现。
2013年3月,Tensilica被全球最大的电子设计技术、程序方案服务和设计服务供应商Cadence以3.8亿美元价格收购,后者看中的正是Tensilica在处理器设计方面的技术。
未来,对于消费者来说“更高级”意味着更快、更大,或者更清晰。它们永远没有尽头,而支持这些的一定需要更好的技术。对于Tensilica来说,它可能看准了一个方向,但也可能需要付出培育市场的代价。