结合模型和迭代编译优化矩阵相乘程序

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:by_huang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高性能计算应用程序获得的持续性能与机器峰值性能的差距日益扩大,很大程度上制约着高性能计算的发展。程序变换通过对程序进行适应机器体系结构特征的优化变换,提高程序实际执行性能,是解决该问题的有效途径之一。很多高级程序变换均具有数值参数,为了获得最优性能,需要仔细选择参数的值。传统的编译器使用简单的模型选择这些参数,难以适应日趋复杂的硬件平台和应用程序。迭代编译通过生成不同的程序版本并在实际硬件评估上运行程序,来评估关键优化参数的值并决定能够产生最优性能的值,显著优于静态方法,但巨大的优化开销限制了其应用范围。
其他文献
爱特梅尔公司(Atmel.)宣布推出首个ATA874x单芯片UHF ASK/FSKRF发送器系列。这一全新AVR.产品线具有业界领先的射频(RF)性能,并可在免授权的ISM频带(868MHz~928MHZ、433MHZ和315MHz)运作
节点的位置信息在无线传感器网络的很多应用中扮演重要的角色。已经提出的基于测距的定位算法几乎都用到了三角测量原理,但当所参考的导标节点共线或接近共线时,较小的测距误差都会带来很大的定位误差。针对这种情况,本文引入共线度概念,只有当所参考的导标节点的共线度大于某阈值时才进行位置估计。仿真结果表明,共线度的引入对减小定位误差有明显效果。
陈独秀年满62岁时,于1942年秋逝世于四川江津县(现重庆市江津市)郊区。61年来,对陈独秀之死,众说纷纭,或日蒋介石所害,或日党内除奸,或日病死。到底陈独秀是怎样死的?而今,有
成都市金牛区委、区政府为发挥党外人士的优势和作用,大力加强特邀监察员工作的组织领导、制度建设、形式开掘,使特邀监察员的民主监督、桥梁纽带、参谋助手作用得到有效发挥。一直以来,金牛区委、区政府把特邀监察员工作列入党风廉政建设工作的重要议事日程,制定出《金牛区监察局特邀监察员
编辑同志: 我是一名党外干部,即将到北京参加中央社会主义学院办的党外干部研讨班。我听说新近颁发了《社会主义学院工作条例》, 很想了解一下这个《条例》的基本内容,特请贵
为神经技术研究提供先进的成套软硬件设备的领先供应商PlexonInc.在神经科学2011年会上宣布推出Plexon光基因刺激系统(OptogeneticStimulationSystem),并借此将其神经科学研究设
王恒丰,男,1942年10月生,59岁,汉族,硕士研究生学历。现任四川省人民政府副省长,民
ARM公司宣布,博通公司已采用ARM Cortex—R4处理器应用于未来的蓝光播放器芯片中。Cortex—R4处理器提供了性能、实时响应和能效之间的独特融合,使蓝光播放器在成本降低的情况
本文提出了一种基于消息的动态工作流引擎的实现方式.该方式通过定义任务项的等价关系,由消息触发反演计算.该反演计算以结点-状态路由算法N-S实现基于能力的任务项的动态路
11月18日,十六大代表、省政协副主席、省委统战部部长肖光成受中共四川省委委托,向各民主党派省委、省工商联负责人、无党派人士、宗教界代表人士及统战部机关全体干部和统战