论文部分内容阅读
近年来,以智能手机、平板电脑和掌上游戏机为代表的嵌入式移动设备逐渐普及,图形处理器(Graphic Processing Unit,GPU)在嵌入式设备上得到了广泛的应用。由于移动设备几乎都以电池为能量来源,所以嵌入式图形处理器必须在功耗的限制下追求性能的提升。“瓦片式”延迟渲染(Tiled-Based Deferred Rendering,TDBR)以其独特的低功耗结构,在嵌入式图形处理器领域几乎处于统治地位。相对于传统的“直接渲染”(Immediate ModeRendering, IMR),TBDR结构的深度测试、模版测试和融合几乎不消耗带宽,从而极大地降低了带宽需求。配合延迟渲染技术,可以完全消除不可见片段的绘制,减少无效的计算。同时,TBDR结构的深度缓存、模板缓存和颜色缓存可以使用更高精度的表示,提高了显示质量。
本文研究了TBDR架构的原理和算法,对基本图形处理算法进行了分析和优化,搭建了基于TBDR架构的算法仿真平台。并且基于该仿真平台,对纹理Cache进行了研究。论文的主要工作如下:
(1)基于TBDR架构的算法仿真平台设计。三维图形处理的研究内容包括了体系结构、算法、高级渲染效果等的研究,这些研究首先需要一个能够用于算法仿真和性能分析的平台,该平台是图形处理流水线的一个软件实现,一般采用C、C++或者SystemC编写。为了研究TBDR渲染结构及该结构下的图形算法,本文针对OpenGL ES标准建立了基于TBDR架构的算法仿真平台,实现了一个性能分析工具。
(2)高效率纹理Cache策略的设计。在图形处理硬件结构中,访存一直是影响整个流水线性能的瓶颈,而Cache正是为解决访存瓶颈而被提出来的。由于TBDR结构深度测试在片内进行,因而相对于IMR结构,深度测试基本不消耗带宽。纹理访存性能便成了影响整个图形处理器性能的关键,论文分析了图形处理器纹理访存的特点,提出了一种高效率纹理缓存策略,支持四路并行读取,并通过纹理预取隐藏了访存延迟,减小了命中率对片段着色率的影响,仿真结果表明,所设计的纹理Cache可以达到零延迟内存系统性能的90%左右。
(3)针对车载视觉系统的三维模型渲染,提出了一种软件解决办法。由于车载视觉系统所使用的三维模型是确定的,变化的只是纹理数据,可以不通过GPU而使用软件的方法对该模型进行渲染,本文提出了一种基于TBDR结构的车载三维视觉系统软件渲染方法。