PTX程序性能分析与建模

被引量 : 0次 | 上传用户:smxxtsm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代科技的进步以及电子产业的飞速发展,GPU运算性能已经被人们开发到无以复加的地步。从以前的单一作为显卡处理器,到现在的大型并行计算处理器.GPU还担当了很多本该是CPU的工作。同时,由于GPU独特的硬件结构,使得在处理大型的并行计算的时候,GPU的处理速度要远远的超过CPU。GPU在通用计算领域有着明显的优势:它的并行性强,能够承受高密度的运算,还可以有效的减少在程序运行过程中GPU和CPU之间频繁的通信。因此,人们对GPU的计算处理能力也是越来越重视。CUDA平台的出现为人们提供了一种这样的编程模型:它不需要学习太多的语言,只需对已有的编程语言就行扩展,大大的降低了CUDA的门槛。随着英伟达新一代显卡Fermi架构的发布,CUDAC编程也被越来越多的人所熟知。CUDAC其实是C语言编程的一个扩展。而PTX是一个利用GPU的可扩展的并行计算。由于永不满足的市场需求、实时驱动的实现、高清晰度三维图形,可编程图形处理器已经演变成为一个高度并行的、多线程的处理器,同时具有庞大的计算能力和较高的内存带宽。GPU处理器特别适合解决此类问题,可以表示为数据并行计算(相同程序执行在许多数据单元中平行的、高强度的内存操作)。因为执行的是同样的程序,所以每个数据元对复杂的流量控制有一个较低的要求。PTX定义了一个虚拟机和通用并行线程执行的指令集。它在安装时被翻译为目标硬件的指令集,通过对PTX的使用,GPU可以作为可编程并行计算机。就像普通的编译过程一样,在GPU中的编程也是要经过高级语言到低级语言,到汇编语言再到二进制语言的过程。从编程语言方面就是从CUDA C到PTX到sass再到cubin的过程。为了准确的计算出程序在GPU中被执行时的指令延迟,我们就要首先排除一切干扰条件,保证我们结果的正确性。如果直接把程序在GPU中执行,那么得到的最终时钟周期内就会包括程序在硬件中由高级道低级的转化过程,那么得出的结果就不能准确的说明问题。因此,在计算时钟周期的时候,我们需要把二进制文件输入硬件中进行执行,这样才能避免转化时间干扰我们最后的结果。首先我们要通过编程来计算出在一个PTX程序中的各条PTX指令的数目。首先设定一个count数组,数组中的每一个count代表一个PTX指令的数目,最后在一个TXT中输出这些指令的数目。进行指令统计程序的目的是为了对每条指令的延迟做出统计,这样就能对一个PTX程序的时钟延迟时间做出预报。通过对GPU的硬件结构分析,来计算出每条PTX指令的时钟延迟。由于指令在GPU中是流水线的方式来执行的,所以我们就可以通过指令在GPU中的工作流程来推算出PTX指令的时钟延迟的一个计算公式,并且通过这个公式可以得出每条PTX指令的延迟,从而可以计算出一个PTX程序的时钟延迟。
其他文献
青海民族文化史是青海民族史的延伸 ,是一门新的学科。文章就如何展开青海民族文化史论述和研究问题作了探讨 ,认为应当坚持总论和分论相结合的方法 ,即 :“总论”以纵述历史
随着起吊行业的迅速发展,起重机已广泛应用于工厂、矿山、车站、港口、建筑工地、水电站、仓库等各个生产部门中。为了达到合理安排起重机资源,安全顺利的进行起重机作业的目的
本文介绍了一种有效的课堂教学模式——"学案导学一交流展示一巩固提升"课堂教学模式.该模式可以有效地提高教学质量,培养学生各方面的能力,适用于初中、高中学生的学习.同时
随着移动通信技术的发展,无线接入技术日益多样化,越来越多的接入设备具有多个网络接口,终端可以同时使用多个网络接口通过不同接入技术接入网络,即利用多家乡特性(multi-hom
农村“科技防腐”即在农村中运用科技手段来预防腐败。在农村基层党风廉政建设推进过程中,如何有效解决农村“三务”(党务、政务、村务)公开不彻底、民主监督不到位、财务管理不
《金锁记》中的曹七巧与《远大前程》中的郝维仙小姐这两位女性人物,虽然造成她们各自扭曲人性的具体原因有所不同,但她们有着同样的怨愤和悲剧。从精神分析的角度来看,婚姻
在人类运用语言传达信息、交流思想的过程中,经常会遇到这样的情况:说话者说出的话偶尔会偏离他真正想要表达的意思,我们称这种现象为口误。关于口误的定义,不同学者有不同观点,Bo
摘要:随着21世纪初文化学中的身体转向,再一次兴起对感官的研究热潮。“盲”与“明”作为眼睛的两种状态始终处于一种紧张关系之中。而“盲”作为母题在埃利亚斯·卡奈蒂的唯一
随着改革开放的深入和世界经济的日益全球化,国内企业正面临越来越大的外部竞争压力。在削减成本以及激烈的竞争压力下,由传统发展新客户向保持现有客户进行转型,越来越成为
目的:了解侵袭性血管黏液瘤的组织学来源、临床和病理特点以及治疗方法和预后。方法:回顾性分析7例侵袭性血管黏液瘤患者的临床病理资料。结果:患者年龄18~72岁,平均43.14岁,