循环变换相关论文
三角公式多,变换途径广。在对学生作三角变换的基础训练时,对一个习题,只用一个公式,一个途径进行计算、化简或恒等变换时,往往是......
该文深入研究了多重循环软件流水,以及当嵌套层数为1时的最差相关限制问题,提出了一种多重循环并行化算法:交替移位旋转(ISR:Inter......
近年来,结合了通用处理器的灵活性和专用集成电路的高效性优点的可重构计算技术获得了广泛深入的研究,它具有灵活高效的结构,非常......
作为具有极大潜力的计算硬件设备,GPU正越来越多的被用于科学计算领域,对具有大量并行性的高吞叶量计算等应用进行计算加速。但在G......
该文在迭代空间变换的基础上,提出了一种利用循环变换增加循环并行粒度,改善循环数据访问局部性的方法.首先针对循环并行粒度的问......
近年来以机群为代表的分布式存储超级计算机系统逐渐成为超级计算机的的主流,与共享存储超级计算机相比,分布式存储机群系统最大的区......
当代的计算机应用程序大部分是多媒体应用,包括音视频处理,图像处理,3D绘图,语音识别等,这就对处理器提出了更加严格的实时性要求......
现代数字信号处理器经常采用超长指令字体系结构。与通用处理器普遍采用的超标量体系结构相比,超长指令字将调度任务交由编译器完成......
日记是对生活经历的记录,有人称它为“心灵的远足”。日记的最初目的在于抒写性情、记录成长,满足心灵的需求,所以这种抒情方式备......
九十八、液压传动系统常见的基本回路有哪几种?各种机械的驱动工作部件,主要的任务有三个方面1.克服工作时的阻力(或力矩);2.根据......
一个好的设计品牌应该是注重设计与美学的,而一个好的设计产品,应该是蕴藏着一些美学因子,可以让观者及使用者感知到它的美的。设......
采用8位微处理器的数字电压表和繁用表已有几种。其中美国HP公司3455 A型电压表有两个微处理器。英国Solartron7055/7065型处理器......
有一位作家说过: “我们只有籍着将工作时间中完全挺直的姿势和工作完毕后躺在沙发中的舒服姿势循环变换,方能成就生活的最高智慧!......
文章对MD5即"Message-Digest Algorithm 5(报文摘要算法)"算法进行了简要描述和分析,并利用目前流行的C#对MD5算法进行了具体的实......
在IA-64架构Itanium2处理器上,应用gprof和pfmon对二维非线性对流扩散方程求解程序源代码进行了性能测试。在分析给定程序的数据结......
在线性空间V中,对于V上的一个线性变换σ是否存在Зα∈V,使得α,σα,σ^2α,……σn-1α构成V的一组基?本文我们将给出上述α存在性的......
本文对文献(1)中提出的产生不循环数值序列的方法进行了改造,用此方法编写了一个数据文件加密程序,其中局部采用了分组技术,提出了序列......
现代的计算机处理器和计算机系统实现了很多先进技术,要利用这些技术更需要编译器的支持以取得高性能。GCC中Tree-SSA优化框架提供......
PADDING是一种提高程序中循环Cache命中率的有效方法,其有效性的关键在于选取合适的PADDING大小以尽可能地消除循环中数组引用之间......
文章[1]中提出了数组之间的数据融合优化方法,并以IA-32服务器为平台测试了数据融合优化的效果。测试结果表明,在IA-32机器上,数据融......
《快车》的底部状态栏会出现一些循环变换的文字广告。这些广告无法在Ⅸ快车》的设置项中关闭,因此很多人部为此而烦恼。其实关闭这......
设计一种基于多面体模型的静态数据依赖分析方法,对程序中的循环体进行分析,将生存周期思想引入到数据的依赖分析中.数据的依赖关......
结点间流水是解决数据分布和计算分割不一致时的一种重要的并行发掘技术.结点间流水通过计算与通信的重叠获得并行度.精确的流水粒......
阐述了一种适用于核外计算程序的变换技术,它通过联合使用循环变换和数据变换这两种编译优化技术来增强程序的局部性,提高数据存取......
在IA-64架构Itanium2处理器上,应用gprof和pfmon对二维非线性对流扩散方程求解程序源代码进行了性能测试。在分析给定程序的数据结......
提出了一种利用循环变换增加循环并行粒度,改善循环数据访问局部性的方法.该方法利用了给定二重循环的相关向量集的某些性质,将外......
循环优化对于提高Cache性能、发掘程序的并行性以及减少执行循环的开销都有着重要的作用,证明带循环优化功能的现代编译器的正确性......
在数学竞赛和数学问题研究中,常常要证明分式不等式,笔者发现,若给原分式P配上恰当的对偶式Q,则产生简捷明快的证法。本文介绍这种......
在并行编译中,循环变换是开发程序并行度的主要方法,但存在复杂控制流的非紧密嵌套循环往往无法得到有效的并行化。文章结合分析Benc......
为讨论Bent函数性质的需要,在研究了线性函数与Bent函数关系及e-偏导数的密码学性质的基础上,本文提出了一种判断布尔函数是否为Be......
循环变换可提高程序性能,但对其向量化后可能会导致代码性能损失,并不一定会得到预期性能提升。针对该问题,结合目标体系结构特征,......
随着CPU芯片上集成的计算核心不断增加,计算机系统峰值性能不断攀升。近年来,多核处理器已经占据桌面,众核处理器即将普及。但是应......
SIMD (Single Instruction Multiple Data)扩展部件已广泛应用于现代高性能计算的并行处理架构中,它使用宽位SIMD寄存器对多个字符......
《千字文》作者为南朝周兴嗣。千字文,即由一千字组成的韵文(在隋唐之前,不押韵、不对仗的文字,被称为"笔",而非"文")。相传梁武帝......
根据嵌入式计算系统设计对实时性、功耗和成本的要求,提出了在嵌入式程序开发过程中,利用循环变换技术和代码放置在编译后端代码生......
cache的使用缓解了CPU和主存储器之间速度差距太大的矛盾,同时,也使cache的命中率成为影响多处理机系统性能发挥的重要因素.人们对如何加强数据的局......