基于申威1621的基础数学库流水线中断优化研究

来源 :中原工学院 | 被引量 : 0次 | 上传用户:fancylhs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的发展,高性能计算机在生产、生活、科技等方面越来越发挥着不可替代的作用。由于高性能硬件体系结构的迅速发展,高性能计算应用软件已无法充分发挥硬件体系结构的优势,因此有必要对高性能计算软件进行优化。基础数学函数库是高性能计算机中必不可少的软件之一,也是编译器至关重要的组成部分,众多领域的高性能计算应用软件都依赖于基础数学函数的计算结果,它的性能直接决定了众多领域的上层应用计算程序的执行效率。为了提升现版本国产申威基础数学函数库的性能,本文在研究申威1621处理器体系结构和程序优化技术的基础上,针对部分函数因浮点控制寄存器读写指令导致的流水线中断问题,提出了两种流水优化的指令段替换方法;应用浮点小数取整法通过提前移位和逻辑等操作将浮点数转换成为浮点整数,解决了浮点数转长字指令的浮点异常问题;提出了和判断法和商判断法,应用终点判断法实现了向0舍入模式下加法计算和除法计算。
  在众多函数的计算过程中,常常需要将一个浮点数转换成一个整型数,并且有时需要设置舍入模式。若浮点数是一个浮点小数而不是浮点整数,在执行浮点数转长字指令后,会触发浮点异常控制器中的非精确异常控制位,从而产生非精确异常。因此本文提出浮点小数取整法,解决因浮点数转长字指令触发的非精确异常问题;
  加法计算和除法计算在数值计算软件是不可缺少的,同时在部分函数中需要计算得出向0舍入模式下的加法和除法的计算结果。而申威1621处理器默认的舍入模式为就近舍入,要想得到向0舍入的计算结果,可以使用浮点控制寄存器读写指令提前设置舍入模式,但该方法会导致流水线中断,严重影响函数的性能。因此本文在分析就近舍入结果与向0舍入结果的关系后,提出终点判断法,实现了在就近舍入模式下得到向0舍入结果的目的。
  实验结果表明,本文提出的方法成功的实现了指令段功能等效替换,对基础数学函数库性能提升明显。
  
其他文献
学位
学位
学位
学位
学位
学位
蛋白质泛素化修饰是重要的蛋白质翻译后修饰之一,在细胞凋亡、转录调控、细胞疾病、DNA修复等基本反应中承担着非常重要的角色。高效而准确的识别泛素化位点对于研究蛋白质泛素化修饰问题具有非常重要的生物意义。传统的基于生物识别方法需要研究人员在大量的蛋白质序列数据中进行生物实验验证,例如CHIP-CHIP分析法和质谱法等,这需要大量的时间和经济成本。而基于计算的识别方法,能够在大规模数据上进行高效而准确的
稀疏解混作为一种重要的高光谱图像混合像元分解方法,通过在大型公共光谱库中搜索目标遥感图像的组成端元特征和其对应丰度来完成解混任务,而融合空间信息的稀疏解混方法已成为目前的重点研究方向。非局部信息作为高光谱图像的重要空间信息可以更为全面地映射出目标图像的空间特性,在高光谱解混领域也逐渐获得了一些关注。但目前的融合空间上下文信息的稀疏解混方法在模型构建上会出现比较复杂的约束项,从而增大求解的难度。对于
人联网(the Internet of People,IoP)是一种以人为中心的新型实时交互式物联网,它的服务理念聚焦于用户的个性化需求,为个人带来了更丰富的交互体验。近年来,IoP系统在医疗监护和健康领域有着较为广泛的研究。由于系统中包含了大量与用户联系紧密的服务,而这些服务中即使存在一些微小的错误,都可能伤害到用户甚至对其造成生命威胁,所以对IoP系统进行可靠性分析十分重要。然而,IoP系统不
学位
现有的基于神经网络的自然语言处理模型依赖于大量目标域内的标记数据进行训练,然而,为低资源目标域收集足够的训练数据通常是昂贵且耗时的。文本序列的迁移学习方法通过将一些在不同但相关的任务或领域的源域中已经获得的知识直接迁移到感兴趣的目标域来提高目标任务的表现,与单任务方法相比具有直接的优势。虽然迁移学习在文本序列的处理上已取得了不错的进展,但是仍面临一些问题,包括不同领域间“迁移什么”和“如何迁移”。
学位