论文部分内容阅读
Nexus 10是一款拥有2560×1600分辨率、搭载Cortex-A15架构三星Exynos 5250双核处理器的平板电脑。最令人惊叹的是,Nexus 10的游戏性能依旧不逊于很多配备四核+1280×720分辨率的设备(要知道,分辨率越高跑分越吃亏)。而Exynos 5250所集成的Mali-T604 GPU,则是让双核+超高分组合战胜四核+标准分辨率组合的核动力。
Mali:ARM的亲儿子
Mali是ARM自己品牌的GPU,就好像Adreno是高通、Geforce是NVIDIA自由品牌一样。ARM并不强买强卖,CPU制造商既可以单独购买ARM v7指令集授权(Cortex-A5/7/8/9/15等架构均基于此指令集设计)并搭载其他品牌GPU生产处理器,也可以直接选择ARM v7+Mali的打包方案来生产处理器。除了三星Exynos系列之外,在全志A10/A13、瑞芯微RK3066、晶晨AML8267MX、意法爱立信U8500等很多品牌的处理器中我们都能看到Mali系列GPU的身影。
Mali-400的升级之作
回到正题,Mali-T604听起来可能很陌生,但若提起Mali-400相信大家就有印象了,三星Exynos 4系列处理器就集成了这款Mali-400MP4 GPU(MP后面的数字代表GPU的核心数量)。可惜Mali-400MP4的性能不是很给力,这就导致Exynos 4在CPU跑分上可轻松超越Tegra 3媲美高通S4,但在GPU跑分上却远不如Geforce和Adreno 225/320。此外,很多采用瑞芯微RK3066(集成Mali-400MP4)+视网膜屏幕(2048×1536)的平板在最高分辨率模式下都会非常卡,从侧面也印证了Mali-400性能不足的现状。
为了挽回颜面,ARM于2012年正式发布了首次正式支持Khronos OpenCL 1.1完整通用计算规格的Mali-T604,也就是Mali-400的升级版。
Mali-T604强在哪里
Mali-T604属于ARM旗下第四代嵌入式图形芯片,着色器数量和Mali-400相同都是1~4,这意味着未来可能同样需要通过Mali-T604MP1~MP4判断该芯片的实际性能。Mali-T604采用了创新性的三管道设计,官方表示最高性能可以达到Mali-400的5倍。这个数据并不夸张,在GLBenchmark 2.5测试软件的对比评测中,集成Mali-T604的Exynos 5250(Nexus 10)性能基本都能达到集成Mali-400MP4的Exynos 4412的3~5倍!
性能飙升主要取决于Mali-T604整体架构的升级。据了解,Mali-T604改变了Mali-400时代的顶点、像素分开渲染方式,而是改用统一渲染化,即通过统一渲染管线来同时处理顶点和像素计算。虽然着色器内核的数量最多仍维持在4个,但却极大地提升了效率。
此外,Mali-400虽然也有抗锯齿功能,但技术层面还停留在AA级别(不支持全屏),而且受限于其自身的性能,抗锯齿基本变成了摆设,导致游戏画面放大后总是锯齿感严重。从Mali-T604开始,ARM终于给其加入了FSAA级别的全屏抗锯齿功能,得益于Mali-T604强悍的性能,在4xFSAA(四倍全屏抗锯齿)时也不会出现明显的性能损失,这意味着用Mali-T604玩Android平台大型3D游戏可让画面变得更平滑。
值得注意的是,Mali-T604进一步加强了对不同API(应用程序编程接口)的支持,正式加入了对OpenCL 1.1(原生支持64bit整数运算)、DirectX 11(和PC级别显卡站在同一起跑线上)以及Renderscript(可渲染3D图形的脚本,效率比Java程序高)。
可能大家看得有点云山雾罩,但只要你明白三个道理就成了:靠这些新加入的API,集成Mali-T604 GPU的处理器可以显示更为精细的图形,有机会运行在传统的PC平台,让PC软件和移动软件的相互移植变得更为方便。
后发制人的Mali-T604
与PowerVR SGX等GPU品牌相比,Mali其实挺“悲催”的,要不是靠着三星Galaxy 2/3/Note/Note2(搭载Exynos 4系列处理器,集成Mali-400MP4)系列这些明星手机的热卖,可能至今仍没多少人会关注他。但是,在单机型就能买到数千万台销量的Galaxy S3等新机的帮助下,ARM的亲儿子终于受到了应用开发者的广泛关注,昔日的兼容性问题早已解决。有了知名度,再加上Mali-T604自身也足够强悍,相信未来Mali-T604也会运行在三星Exynos 5系列以外的更多品牌处理器身上。
Mali:ARM的亲儿子
Mali是ARM自己品牌的GPU,就好像Adreno是高通、Geforce是NVIDIA自由品牌一样。ARM并不强买强卖,CPU制造商既可以单独购买ARM v7指令集授权(Cortex-A5/7/8/9/15等架构均基于此指令集设计)并搭载其他品牌GPU生产处理器,也可以直接选择ARM v7+Mali的打包方案来生产处理器。除了三星Exynos系列之外,在全志A10/A13、瑞芯微RK3066、晶晨AML8267MX、意法爱立信U8500等很多品牌的处理器中我们都能看到Mali系列GPU的身影。
Mali-400的升级之作
回到正题,Mali-T604听起来可能很陌生,但若提起Mali-400相信大家就有印象了,三星Exynos 4系列处理器就集成了这款Mali-400MP4 GPU(MP后面的数字代表GPU的核心数量)。可惜Mali-400MP4的性能不是很给力,这就导致Exynos 4在CPU跑分上可轻松超越Tegra 3媲美高通S4,但在GPU跑分上却远不如Geforce和Adreno 225/320。此外,很多采用瑞芯微RK3066(集成Mali-400MP4)+视网膜屏幕(2048×1536)的平板在最高分辨率模式下都会非常卡,从侧面也印证了Mali-400性能不足的现状。
为了挽回颜面,ARM于2012年正式发布了首次正式支持Khronos OpenCL 1.1完整通用计算规格的Mali-T604,也就是Mali-400的升级版。
Mali-T604强在哪里
Mali-T604属于ARM旗下第四代嵌入式图形芯片,着色器数量和Mali-400相同都是1~4,这意味着未来可能同样需要通过Mali-T604MP1~MP4判断该芯片的实际性能。Mali-T604采用了创新性的三管道设计,官方表示最高性能可以达到Mali-400的5倍。这个数据并不夸张,在GLBenchmark 2.5测试软件的对比评测中,集成Mali-T604的Exynos 5250(Nexus 10)性能基本都能达到集成Mali-400MP4的Exynos 4412的3~5倍!
性能飙升主要取决于Mali-T604整体架构的升级。据了解,Mali-T604改变了Mali-400时代的顶点、像素分开渲染方式,而是改用统一渲染化,即通过统一渲染管线来同时处理顶点和像素计算。虽然着色器内核的数量最多仍维持在4个,但却极大地提升了效率。
此外,Mali-400虽然也有抗锯齿功能,但技术层面还停留在AA级别(不支持全屏),而且受限于其自身的性能,抗锯齿基本变成了摆设,导致游戏画面放大后总是锯齿感严重。从Mali-T604开始,ARM终于给其加入了FSAA级别的全屏抗锯齿功能,得益于Mali-T604强悍的性能,在4xFSAA(四倍全屏抗锯齿)时也不会出现明显的性能损失,这意味着用Mali-T604玩Android平台大型3D游戏可让画面变得更平滑。
值得注意的是,Mali-T604进一步加强了对不同API(应用程序编程接口)的支持,正式加入了对OpenCL 1.1(原生支持64bit整数运算)、DirectX 11(和PC级别显卡站在同一起跑线上)以及Renderscript(可渲染3D图形的脚本,效率比Java程序高)。
可能大家看得有点云山雾罩,但只要你明白三个道理就成了:靠这些新加入的API,集成Mali-T604 GPU的处理器可以显示更为精细的图形,有机会运行在传统的PC平台,让PC软件和移动软件的相互移植变得更为方便。
后发制人的Mali-T604
与PowerVR SGX等GPU品牌相比,Mali其实挺“悲催”的,要不是靠着三星Galaxy 2/3/Note/Note2(搭载Exynos 4系列处理器,集成Mali-400MP4)系列这些明星手机的热卖,可能至今仍没多少人会关注他。但是,在单机型就能买到数千万台销量的Galaxy S3等新机的帮助下,ARM的亲儿子终于受到了应用开发者的广泛关注,昔日的兼容性问题早已解决。有了知名度,再加上Mali-T604自身也足够强悍,相信未来Mali-T604也会运行在三星Exynos 5系列以外的更多品牌处理器身上。