【摘 要】
:
随着高性能计算需求的日益增加,片上众核(many-core)处理器成为未来处理器架构的发展方向.快速傅立叶变换(FFT)作为高性能计算中的重要应用,对计算能力和通信带宽都有较高的要求.
【机 构】
:
中国科学院计算技术研究所系统结构重点实验室
【基金项目】
:
本课题得到国家“九七三”重点基础研究发展规划项目基金(2005CB321600)和国家自然科学基金重点项目(60736012)资助.
论文部分内容阅读
随着高性能计算需求的日益增加,片上众核(many-core)处理器成为未来处理器架构的发展方向.快速傅立叶变换(FFT)作为高性能计算中的重要应用,对计算能力和通信带宽都有较高的要求.因此基于众核处理器平台,实现高效、可扩展的FFT算法是算法和体系结构设计者共同面临的挑战.文中在众核处理器Godson-T平台上对1-D FFT算法进行了优化和评估,在节省几乎三分之一L2 Cache存储开销的情况下,通过隐藏矩阵转置,计算与通信重叠等优化策略,使得优化后的1-D FFT算法达到3倍以上的性能提升.并通过片上
其他文献
目的探讨不同临床类型乙型肝炎病毒(HBV)感染患者免疫功能水平,并分析HBV感染类型与免疫功能的相关性。方法纳入我院收治的HBV感染患者208例,根据不同临床类型分为A组(急性乙
该文引入了单体二阶Lukasiewicz逻辑,进而给出了模糊有穷自动机识别语言的逻辑描述,证明了多值逻辑意义下的Buchi与Elgot基本定理.通过引入星-自由模糊语言与非周期模糊语言,刻画
目的分析小肝癌MR信号特征与手术切除术后无瘤生存期的相关性。方法随访观察2010年12月至2017年1月解放军第三○二医院手术切除初发小肝癌且于术前1周至1月进行MR动态增强扫