自动向量化中基于混合并行的循环分段展开技术

来源 :2011年全国高性能计算学术年会(HPC china2011) | 被引量 : 0次 | 上传用户:physicalboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  当前含有SIMD功能部件的计算机体系结构中,其向量部件与标量部件一般可并行工作。为了提高系统的硬件资源利用率,论文针对向量化循环,提出了基于混合并行的分段展开变换方法。论文以处理器的硬件模型为基础,分析了开发混合并行的限制条件,设计了一种针对此模型的循环分段展开算法,可将原来完全向量化的循环,变换为向量与标量混合计算的循环。通过此方法,可以提高系统的资源利用率,经对SPECCPU2000浮点测试表明,此向量化方法对加速比平均有10%左右的提升。
其他文献
  线弹性理论广泛应用于结构分析与工程设计,与之对应的线弹性问题亦为工程与科学计算研究的重要对象。本论文首先提出线弹性问题模型。然后,详细介绍一种适用于求解线弹性问
  归约算法在科学计算和图像等领域有着广泛应用,本文系统研究了在OpenCL 框架下,归约算法在 GPU上的跨平台性能优化.已有研究工作一般只侧重单个硬件架构,本文基于 OpenCL
会议
改革开放以来,中国外商直接投资和对外直接投资刺激了经济繁荣发展,但与此同时,中国水环境污染与经济发展的矛盾愈来愈突出,尤其是大量排放的工业废水,严重影响了中国的生态
  现代GPU一般都提供特定硬件(如纹理部件、光栅化部件及各种片上缓存)以加速二维图像的处理和显示过程,相应的编程模型(CUDA、OpenCL)都定义了特定程序设计接口(CUDA的纹
会议
2001年北京大运会体操冠军张尚武近日受到社会的广泛关注,其程度远远超过他当年“为国争光”的时候。原因是他以盗窃罪入狱三年十个月刑满释放后在王府井街头卖艺乞讨,一经网
2020年11月27日,《上海市促进家庭农场发展条例》经上海市第十五届人民代表大会常务委员会第二十七次会议表决通过,从2021年1月1日起正式施行.这是国内首个关于家庭农场的地
期刊
  视频转码是一项耗时耗资源的工作。随着视频数据量的急剧增大,传统转码方式已经不能满足人们对效率和质量的需求。云计算通过整合、调配计算资源向用户提供强大的计算能力
会议
正六千张便利贴能够做什么?提醒?记事?或是,拼出可爱的心型? 2009年,24岁的台湾学生刘邦耀把它们糊在了墙上,搭配真人演出,拼成了动画。一分五十五秒的短片,用了他三个月的制
这天,家住四川江油市重华镇的梅文杰大爷告诉记者:“我把自己多年淘得的2000多件收藏品拿出来免费展览,一心想把重华古镇的灵魂留住!我希望大家能和我一起保护好重华古镇的根
韭菜是可以周年进行生产,一年四 季供应的蔬菜。由于韭菜生长周期短,有 些病害较难防治,因此,有些地方大量滥 施乱用剧毒农药和化学肥料,致使韭菜 产品中的农药残留严重超标,对广大