【摘 要】
:
本文分析了二维网孔(MC2)结构中的矩阵转置并行算法的原理,并针对其处理节点多、节点间通信的频率高、通信数据量大而导致计算效率低、成本高的缺点,提出了直角划分矩阵转置并行算法。该算法将矩阵中互换位置的两个元素划分在同一个子块中,由同一个处理机进行转置计算,有效地避免了处理机之间的通信,提高了计算效率.通过对测试结果进行分析,证明该算法合理划分矩阵,减小了处理节点间通信开销,从而大大提高了并行计算的
【机 构】
:
成都信息工程学院计算机系,成都,610225
【出 处】
:
2006中国计算机学会体系结构专委会学术年会
论文部分内容阅读
本文分析了二维网孔(MC2)结构中的矩阵转置并行算法的原理,并针对其处理节点多、节点间通信的频率高、通信数据量大而导致计算效率低、成本高的缺点,提出了直角划分矩阵转置并行算法。该算法将矩阵中互换位置的两个元素划分在同一个子块中,由同一个处理机进行转置计算,有效地避免了处理机之间的通信,提高了计算效率.通过对测试结果进行分析,证明该算法合理划分矩阵,减小了处理节点间通信开销,从而大大提高了并行计算的效率。
其他文献
本文在改进LSC模型过程中提出了一种新的智能构建模型--感觉行为模型,并用这种新的模型来构建多层智能系统,最后通过计算机仿真来验证提出模型的正确性。
本文在总结了一些具有共性的网络蠕虫(冲击波,震荡波,狙击波等等)的行为特征,提出了一种蠕虫专杀工具的设计并用C++语言进行了描述实现。
本文在深入研究计算机鼓轮的基础上,提出了一种新颖的对称密钥加解密算法。该算法首先通过不同的鼓轮以及鼓轮上的某几位依次对要加密的串加密,形成二维数组;其次,对该数组按列加密,从而形成加密的串。解密过程与加密过程相反。本算法在性能分析后发现加密性能良好,起到了一定的阻止破译者的作用。
本文根据开放式环境的特点,首先构造了一个四层开放式协同设计环境,接着提出了一种适合于此环境的事务提交协议(O1PC),并分析了该提交协议处理故障的情况。该协议具有较好的消息复杂度和日志复杂度,并解决 了一阶段事务提交协议中的站点自治问题。
本文分析了桌面文本搜索应用的指令级特征,发现该应用具有内存带宽利用率低、CPI值相对比较高、分支预测失效率高的特点,并设计了基于倒排索引技术和向量空间模型的并行桌面搜索系统,取得了较好的加速比。研究结果表明,桌面文本搜索应用可以通过多线程并行化在未来的多内核处理器上有效地执行。
本文首先介绍了UWB在无线个域网中的应用,分析了WPAN标准协议IEEE802.15.3,并指出将其应用于高速无线个域网实时数据传输时存在的不足;接着分析了GRATS协议以及IEEE802.11协议;基于GRATS和IEEE802.11,提出了一种新的高速无线个域网MAC方案,并给出了相应的算法;最后,通过对该算法进行模拟分析,表明此算法在保证UWB的无线个域网实时数据有效传输的前提下,利用了带宽
本文在介绍CTMAC协议的基础上,对该协议的并发规则进行了证明,并从理论上讨论了CTMAC协议的开销。通过模拟并与IEEE 802.11和MACA-P比较表明,CTMAC协议可以有效的提高网络吞吐量。
本文分析存储系统延迟的主要原因,提出退化链数据猜测方法,该方法利用数据猜测打破循环的有环相关图中某些限制,拓宽内存访问操作的指令调度空间。实验证明,该方法可以开发软件流水对存储系统的优化潜力。
本文在分析了待调度任务对本地资源和远程节点资源的影响后,提出了一种基于竞争分析的面向多资源的负载平衡算法(MRLB)。该算法借鉴了经济学上的边际成本思想,负载平衡的目标也不局限于CPU资源,而是扩大到所有的系统资源上。算法能在系统全局信息不完整或者信息存在较大延迟的情况下正常工作,有效地消除了负载信息不准确以及负载集中对算法稳定性的不利影响。模拟实验表明,本算法减少了任务的平均减速,并能在保证系统
本文介绍了OGSI规范,指出了OGSI和Web服务不能很好融合的缺点.WSRF利用了新的Web服务标准,重构和发展了OGSI,实现了网格和Web服务的融合。分析了WSRF和WS-Notification主要规范,并讨论了WS-RF和OGSI的关系,最后对未来的发展趋势进行了展望。