X-DSP中初等函数计算引擎的设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:hubingguixuejing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
X-DSP是一款我国自主研发的64位数据位宽的多核通用数字信号处理器,广泛应用于高性能计算、图像和视频的处理等领域,但其浮点基本函数运算单元的发展相对缓慢,仍然有很高的提升空间。论文依托X-DSP项目,旨在改进其内核运算部件中的浮点运算单元。主要工作包括:1.完成了基于Chebyshev插值多项式算法逼近单精度浮点初等函数设计。基于Chebyshev插值多项式算法,通过分析各单精度浮点函数分段多项式逼近的参数,包括多项式项数和检索位宽,确定了以三次四项多项式分段逼近各浮点初等函数。整体结构共分三大模块:预处理模块、多项式计算、后处理模块。通过设计其中的关键模块如基4booth算法乘法器、数前导0模块、4-2加法器、基于CSD算法的/2?常系数乘法器,完成整体硬件结构设计。2.完成了SIMD结构的半精度浮点初等函数计算模块设计。在Chebyshev插值多项式算法计算单精度浮点函数基础上,通过分析各半精度浮点函数分段多项式逼近的参数,确定了以二次三项多项式分段逼近各半精度浮点初等函数并实现其整体硬件结构。通过合理的分配使用乘法器,合理设计数前导0模块和4-2加法器模块,实现了SIMD结构的半精度浮点函数计算,同时可以复用单精度浮点函数计算通路的绝大部分硬件模块,大大减少了硬件面积。3.提出多级查找与Taylor展开相结合的算法。针对硬件函数在分段多项式逼近算法中遇到的精度损失问题,本文提出了多级查找与Taylor展开结合算法,解决了其精度损失问题,使得对数函数计算结果相对误差小于1ulp。当输入数据检索位宽全部为0时,选择多级查找通路,其他输入仍由单级多项式逼近算法完成。4.完成了初等函数计算引擎的验证与综合。通过现有验证环境与综合环境对设计进行验证与性能评估。测试结果表明,单精度和SIMD结构半精度浮点函数计算结果相对误差可以达到目标精度(1ulp)。论文研究结果表明,改进的浮点基本函数计算的性能和精度有明显的提高。
其他文献
目的 观察康复新液、口腔炎喷雾剂联合抗生素治疗化脓性扁桃体炎临床疗效。方法 选取2015年1月至2016年6月我院收治的儿童化脓性扁桃体炎46例,随机分为对照组20例(给予常规抗
【正】 每当节日和盛会,在广东省内的客家地区总能听到一阵阵高亢舒展的锣鼓声,配以悠扬婉转的广东汉乐,奏出了娱乐升平春满人间的景象。锣鼓声和乐曲声融为一体,显得古朴里
构建财务危机预警系统是我国资本市场理想发展的需要,本文从理论依据、经济基础和技术支撑3个方面分析了构建我国上市公司财务危机预警系统的可行性,提出了构建财务危机预警
目的 分析宁波市乙型肝炎(乙肝)表面抗原(HBsAg)阳性母亲所生儿童乙肝疫苗(HepB)和乙肝免疫球蛋白(HBIG)接种率。方法 通过宁波市产科预防接种信息系统收集2013-2018年宁波市HBsAg阳
游戏游艺产业中三人转马系列产品,为了提高游玩者的乘坐舒适性和安全性,通常做法是购买一台市售通用的变频器作启动、运行和停止的动作.应用变频器的主要目的是让设备启动和
通过透照试验,比较75Se源γ射线、192Ir源γ射线与X射线的照相特性,以及不同射线源与不同种类胶片和不同厚度增感屏的组合系统的照相灵敏度;测定了75Se源γ射线的透照厚度与
1被检部件在笔者参与的某火电厂1号机组低温再热器换管焊缝射线探伤工程中,低温再热器管子材质是SA213-T22,规格为(?)63.5 mm×4.2mm,共有51排,每排10根管子,每排间距220
针对景深突变、区域遮挡等因素导致的倾斜立体影像中同名建筑物角点难以准确匹配的难题,提出一种基于核线驱动和自适应窗口的鲁棒匹配算法。算法分3个阶段:①提取重复度较高、
统编教材的习作单元由六个板块组成:"单元导语""精读课文""交流平台""初试身手""习作例文"和"单元习作"。与其他单元相比,"习作例文"板块是一个特殊的存在。从单元整组的目标
甜蜜素为食品生产中常见的一种添加剂,其对于食品甜味的提升效果显著。但如果长期过量摄入甜蜜素,则对于人体机能造成了较大的危害。因此在相关食品的生产作业中,落实甜蜜素