论文部分内容阅读
本文介绍了80位浮点运算的编译实现技术,在IA-64平台上针对一套科学计算测试程序进行了性能瓶颈分析。利用IA-64体系结构特点,改进和实现了用户定义函数的自动内联、高级循环变换、数据顸取、80位浮点数学库函数内联扩展四种编译优化。测试结果表明,这些优化手段显著提高了80住浮点运算的串行性能和并行性能。