面向CPU-GPU架构的源到源自动映射方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:twffhvknnh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对GPU上应用开发移植困难的问题,提出了一种串行计算源程序到并行计算源程序的映射方法。该方法从串行源程序中获得可并行化循环的层次信息,建立循环体结构与GPU线程的对应关系,生成GPU端核心函数代码;根据变量引用读写属性生成CPU端控制代码。基于该方法实现了一个编译原型系统,完成了C语言源程序到CUDA源程序的自动生成。对原型系统在功能和性能方面的测试结果表明,该系统生成的CUDA源程序与C语言源程序在功能上一致,其性能有显著提高,在一定程度上解决了计算密集型应用向CPU-GPU异构多核系统移植困难的问题
其他文献
通过深入研究中医传统理论,临床实践和现代中医药研究的新成果,提出中医药防治疾病的内在规律瓣假说,即“双调自稳规律”,试图解释中医理论的合理内核,指导中医临床实践,使呀知理论
针对船舶随涌浪进行的升沉运动进行较为深入的研究,旨在采用主动式波浪补偿解决耙吸式疏浚船耙管终端水平高度稳定问题。建立波浪补偿预测系统,通过运动参考单元测量船舶运动
现有的ORM模型语义冲突检查方法针对的是全局模型,检查时间长,不能支持建模工具即时检查的需要。为满足即时检查ORM模型的要求,提出了10种局部语义冲突检查模式和算法。基本
中国古代数学与中医学孟庆云(中国中医研究院基础理论研究所北京100700)关键词中医学古代数学中国是许多科学的发祥地之一,中国古代数学和医学的成就皆令人瞩目,二者不仅共出一辙,又比肩
对商务名片进行自动识别,二值化处理是非常关键的一步,其效果将直接影响到后面的版面分析以及字符的分割和识别。而现有的二值化算法时间复杂度高,并且缺乏针对性。提出了一种专门针对商务名片的快速二值化算法,该算法利用颜色模型,通过优化带权误差平方和目标函数找到最优阈值,并给出一个快速迭代算法。经过大量实验证明,相比于传统二值化算法,该算法在嵌入式环境中对商务名片图像做二值化处理,不仅降低了时间复杂度,提高
为了克服传统恒模算法(CMA)收敛速度慢与无相位纠错能力的缺点,提出了一种均方轮廓多小波盲均衡算法(MWTSCA)。该算法一方面利用均方轮廓算法对相位模糊予以及时纠正,且对非常模
随着医学模式与健康观念的改变,服务范围的延伸以及“以人为本”服务理念的深入,健康教育已经成为临床护理工作的重要组成部分。护士在健康教育中担当了重要角色,促进健康、加强
行为研究是为用户推送个性化服务的关键问题之一。针对移动环境下用户行为的情景敏感性,以及前一行为与后续行为之间的关联性、序列性特征,提出一种以情景感知和情景约束为基
从中科大这份自主招生试题看,我们得出以下4点结论:1)著名高校自主招生要求考生数学视野开阔,不局限于高考(考试大纲、考试说明),但不超过现行课标设定的知识与能力要求(只是当下常态