申威26010众核处理器上一维FFT实现与优化

来源 :软件学报 | 被引量 : 0次 | 上传用户:likeu111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据申威26010众核处理器的特点提出了基于两层分解的一维FFT众核并行算法.该算法基于迭代的Stockham FFT计算框架和Cooley-Tukey FFT算法,将大规模FFT分解成一系列的小规模FFT来计算,并通过设计合理的任务划分方式、寄存器通信、双缓冲以及SIMD向量化等与计算平台相关的优化方法来提高FFT的计算性能.最后对所提出算法的性能进行了测试,相比于单主核上运行的FFTW3.3.4库,获得了平均44.53x的加速比,最高加速比可达56.33x,且其带宽利用率最高可达83.45%.
其他文献
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
众所周知,俄罗斯有着丰富的自然资源,特别是石油和天然气,蕴藏量都非常大,俄罗斯出口的产品也主要是以能源、资源性产品为主。近年来,在俄罗斯的众多贸易合作伙伴中,同是“金砖国家
三七中的皂苷成分具有重要的药用价值,而三七皂苷的转化产物是生理活性更高、应用价值更大的次生活性皂苷产物,具有较好的开发前景。本论文从霉变三七中筛选出了能够转化三七
随着我国经济发展多年的高速增长,科技创新能力也随之不断提高。近年来中国农药工业发展十分迅速,2011年,农药制造业共完成工业总产值774亿元,同比增长21%;实现产品销售收入740亿