面向部分向量化的循环分布及聚合优化

来源 :计算机科学 | 被引量 : 0次 | 上传用户:shmilygang8751
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大量循环中都存在着少数无法向量化的语句以及许多可向量化语句,循环分布通常可以将这些语句分离到不同的循环中,进而实现循环的部分向量化。目前主流的优化编译器仅支持简单激进的循环分布方法,因而导致向量化后的循环开销过大,且不利于寄存器和cache的重用。针对上述问题,提出了面向部分向量化的循环分布及聚合方法。首先,分析了一般循环分布的两个关键问题:语句集的划分和循环执行顺序的确定;其次,提出了面向最大聚合的凝聚图结点排序方法来指导循环合并,在不影响并行性的前提下减小了循环开销;最后,通过实验对提出的方法进行了验
其他文献
人口激增、耕地锐减和社会消费水平不断提高已成为不可逆转的发展趋势,“九五”期间,扎实开蔬菜 粮棉油单产增一成活动,是实现“双增目标,确保农业持续发展的现实途径;加大新技术
本文提出用功率谱法、对随机载荷作用下的部件进行疲劳寿命估计。我们采用付立叶变换方法进行频域到时域的变换、建立了时域历程的数学模型。用它来测算部件的疲劳寿命收到了
本文对决定PTA半连联工艺生产BHET产质量的两个主要因素--反应温度及分馏塔水集收速率的影响进行了分析。并提出了相应的改进措施。
医学图像由于具有复杂性,在对其进行图像分割时存在很大的不确定性,为了提高模糊c均值聚类算法(FCM)在处理医学图像分割时的性能,提出一种新的混合方法进行图像分割。利用FCM算法将图像像素分成均匀的区域,融合引力搜索算法,将改进的引力搜索算法纳入模糊c均值聚类算法中,以找到最优聚类中心,使模糊c均值聚类的适应度函数值最小,从而提高分割效果。实验结果表明,相对于传统的聚类算法,所提算法在分割复杂的医学
软件定义网络(Software-defined network,SDN)作为一种新兴的网络范式,通过解耦控制平面与数据转发平面,集中控制并且聚集全网视图,在控制平面与数据平面建立开放接口,启用外部