论文部分内容阅读
显卡全称为显示接口卡(GPU),自电子计算机被发明以来,一直是计算机的基本配置之一。在计算机发展的初期阶段,显卡的性能较弱,仅在主机中承担显示图形的作用;随着近半个世纪的发展,显卡的性能突飞猛进,并凭借其特殊的架构,使得当代显卡的浮点、并行计算能力数十倍乃至于上百倍于中央处理器(CPU)。在传统的科学计算中,由于单个CPU的计算能力较弱,导致计算速度缓慢,而多个CPU并行计算虽然能提高计算速度,大型计算机集群又过于耗费资源。显卡正好可以补足传统计算的短板,因此,显卡在未来的科学计算中将处于十分重要的地位。本文中,我们采用显卡加速的策略,计算氧化铝团簇的能量和梯度,统计了显卡相比传统中央处理器的加速比,并将显卡加速运用到氧化铝团簇结构的全局优化当中。主要内容如下:1、基于显卡加速的能量和梯度的计算对于氧化铝团簇,我们把它当作一个刚性模型,它的势能函数共有四项,将势能函数项放入显卡中进行计算,最终得到了很高的加速比。得出结论如下:设计了三种不同的加速策略,一维操作、块操作和二维操作,以及两种精度,单精度和双精度。在单精度条件下,一维操作、块操作和二维操作峰值加速比分别为220、240和77;双精度条件下,一维操作、块操作和二维操作峰值加速比分别为103、107和35。对于小尺寸团簇,二维操作的加速比具有绝对优势,一维操作和块操作的加速比都非常小;对于中等尺寸团簇,二维操作无法计算,块操作加速比开始显著增加,远远高于一维操作,并更早的达到了峰值加速比;对于大尺寸团簇,一维操作与块操作加速比达到饱和,块操作峰值加速比略微大于一维操作。2、显卡加速在氧化铝团簇电子结构优化中的应用采用显卡加速结合遗传算法预测了(Al2O3)n(n=1-15)团簇的结构并分析了它们的结构特点。由于团簇尺寸较小以及对精度的高要求,我们采用的是二维的双精度操作,峰值加速比为35倍左右。得出结论如下:在n=1-3时,全局最优结构分别为笼状,笼状和茶壶形状;当n=4和5时,都是高度对称的笼状结构;当n=6时,结构倾向于无序;当n=7-9时,也是高度对称的大型笼状结构;当n=10时,结构又倾向于无序。先前文献报道过的(Al2O3)n (n=1-10)的结构在我们的方法中均得到了重现。此外我们还预测出n=11-15的结构,这些团簇结构先前从未报道过。当n=11时,最优结构和n=7结构较为相似;当n=12时,结构是无序的,但在特定角度某些原子可以重叠;当n=13和14时,最优结构对称性分别为Cs和D2;当n=15时,结构是无序的。