大点数一维FFT的GPU设计实现

来源 :计算机工程与科学 | 被引量 : 8次 | 上传用户:yc668
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
鉴于GPU强大的计算性能以及先进的并行处理器架构,主要研究一种将FFT的并行算法映射到CUDA模型的并行设计方法。该设计方法遵循如减少内核函数中的全局存储器访问、全局存储器合并访问、高效利用共享存储器、高密集度计算等GPU平台下主要的设计准则进行优化设计,并在基于NVIDIA Fermi处理架构的Tesla C2075GPU平台上进行了大点数一维FFT设计实现。实验结果表明了该方法的可行性及高效性,在256K点范围内性能优于CUFFT库,加速比最高达到CUFFT 4.0库的2.1倍。
其他文献
支持向量机的参数选择仍未有系统的理论指导,其优化选择一直是支持向量机的一个重要研究方向。考虑到人工鱼群算法优化支持向量机参数往往易陷入最优参数组合微小邻域的问题,构
目前船舶认识实习存在学生对实习的意义认识不够、教学设施不足、环境恶劣、动手锻炼的机会少、监管力度不够等问题,分类分析上述问题,提出了改革评价考核方向、提高学生认识
提出了一种IPv6网络中基于路由协议的PMTU发现机制。通过对路由协议的扩展,在原有的路由信息中携带路由的MTU值,使路由的MTU在网络中传递,执行PMTU探测的主机最多只需要向其第一
传统网络攻击图的生成随着网络规模扩大存在状态爆炸问题,网络安全管理员往往拿着冗余的攻击图不知所措。为了消除攻击图中不必要的攻击路径,保留下最优的攻击路径以供管理员
针对业务规则语言繁杂而导致的信息系统难以升级或迁移等问题,在分析现有业务规则开发方法基础上,采用分层体系结构,提出了一种独立于规则引擎的基于映射机制的业务规则生成
自认证公钥密码体制与签密思想相结合,使得消息在一个合理逻辑步骤内既签名又加密,同时无需公钥证书和密钥托管,为系统节约开销和存储空间,设计安全、高效的自认证签密方案尤
研究了以单轴晶体为内包层,且晶体光轴沿光纤轴线(Z轴)方向的双层光纤的传输等特性,给出了3个区域中电磁场满足的波动方程及其解,得出了矢量模的精确特征方程,重点研究了晶体主轴折
讨论了二维Hilbert空间上线性算子正逼近的唯一性;对无限维Hilbert空间上存在唯一正逼近的线性算子进行了刻画;给出了一类线性算子不存在唯一正逼近的充分条件.