【摘 要】
:
随着技术的发展和应用需求的提升,神经网络、数字信号处理、无线通信技术等领域中涉及到大量高精度浮点数运算。而矩阵运算作为信号处理的基础运算在各个领域中得到广泛应用。求逆运算是矩阵运算中最复杂的运算。传统的求逆算法由于运算复杂度过高,过程复杂不利于硬件实现。因此,国内外大量研究团队提出了一系列矩阵求逆的方法,并在硬件上进行验证和实现。矩阵求逆运算的运算复杂度与阶数三次方成正比,现有的矩阵求逆器的面向对
论文部分内容阅读
随着技术的发展和应用需求的提升,神经网络、数字信号处理、无线通信技术等领域中涉及到大量高精度浮点数运算。而矩阵运算作为信号处理的基础运算在各个领域中得到广泛应用。求逆运算是矩阵运算中最复杂的运算。传统的求逆算法由于运算复杂度过高,过程复杂不利于硬件实现。因此,国内外大量研究团队提出了一系列矩阵求逆的方法,并在硬件上进行验证和实现。矩阵求逆运算的运算复杂度与阶数三次方成正比,现有的矩阵求逆器的面向对象大多数为一些基于定点数的特殊矩阵或者定规模矩阵。因此,设计一款面向高精度高维度的硬件矩阵求逆器具有十分重要架构探索意义和工程实用价值。综上所述,本文在深入研究了现有矩阵求逆算法和硬件实现架构,开展了以下主要工作:(1)对现有矩阵求逆算法进行分析和探究,根据算法本身的运算复杂度,硬件实现复杂度和数值稳定性等特点,选取基于按列Givens旋转的矩阵分解算法,并在其基础上综合使用原位替换的并行Column-wise Givens Rotation(CGR)分解方法,和分块求逆的上三角矩阵求逆方法,充分发挥算法并行特性,确保实际电路性能。(2)根据CGR算法的特性,设计了矩阵求逆运算的硬件加速器,用于加速双精度浮点方阵的求逆。在矩阵的QR分解过程中,优化二维脉冲阵列结构,设计了一维线性结构,该结构充分发挥了CGR算法的流水化计算过程特征,压缩了分解过程中的运算周期。(3)按照标准ASCI流程完成了仿真验证、综合实现、后端优化以及版图实现,最后在Xlinx XC7V440T FPGA平台上搭建验证环境并验证。实验结果表明,本文设计的矩阵求逆器可支持任意2-32阶的双精度浮点数矩阵求逆运算,在TSMC28nm工艺下,该求逆器支持工作频率为700MHz,芯片面积为1.08mm2,可在14123个周期内完成32阶双精度浮点矩阵求逆运算,计算结果与MATLAB的平均相对误差在10-8以下,频率归一后其性能是AMD Ryzen 5 3500U CPU的40倍,面积归一后性能是NVIDIA RTX3070 GPU的118倍。
其他文献
为了研究新型组合材料CFRP筋混凝土梁基本性能,在 ABAQUS 平台上对CFRP筋混凝土梁进行了基本性能分析。首先,对钢筋混凝土梁进行建模和静态试验,得到基本受力性能模拟值;然后,采用带有复合材料CFRP筋混凝土梁进行替换,得到不同材料的基本性能模拟值;最后,对比了两种不同材料受力的影响,研究结果符合理论计算。
目的:通过对多囊卵巢综合征合并2型糖尿病患者与多囊卵巢综合征患者、2型糖尿病患者和正常对照组的临床特征及血清代谢差异物的比较,探讨多囊卵巢综合征和2型糖尿病的胰岛素抵抗的发病机制、筛选多囊卵巢综合并2型糖尿病可能的特异性标志物,为疾病的临床诊断和个性化治疗提供依据。方法:采用临床研究与代谢组学技术相结合的方法,以鹿特丹诊断标准及2013年版中国2型糖尿病防治指南中2型糖尿病诊断标准为依据,收集PC
目的:探究针刺百会透曲鬓穴对脑出血大鼠自噬及mTOR信号通路的影响方法:将126只健康清洁级雄性Sprague-Dawley大鼠(300±10g)随机分成7组,假手术组(Sham组)、脑出血模型组(模型组)、模型+针刺组(针刺组)、3-MA组、3-MA+针刺组、雷帕霉素组、雷帕霉素+针刺组。每组按时间点(1d、3d、7d)分3个亚组,每个亚组6只。根据大鼠立体定位图谱,将50μL自体血注入到大鼠尾
目的:探究中医学脾湿证嗜睡的神经生物学实质,揭示肥胖或长期高血脂患者白天睡眠过多(嗜睡)的病理生理学机制。方法:根据中医学“过食肥甘厚味伤脾”的病因病机理论建立脾湿体质肥胖动物模型,通过对动物的体重及行为学变化的观察,从中医学辨证的角度对动物模型确认,同时应用燥湿健脾方剂干预,进行“以方测证”。C57BL/6小鼠随机分为普通饮食组、高脂饮食组、自然恢复组、非诺贝特组及二陈汤组5组。普通饮食组和高脂
目的:1.研究分析PCOS患者不同中医证型的分布情况,及各证型患者临床特征的差异;2.评估PCOS患者新生儿脐血中性腺激素及糖脂代谢的特点;3.应用iTRAQ技术联合LC-MS/MS分析对PCOS患者的胎盘进行蛋白质组学研究,寻找差异表达蛋白质,构建PCOS患者胎盘差异蛋白质的表达图谱,探索PCOS可能的“胎源性”发病机制。方法:本研究分为临床研究和蛋白质组学研究两大部分。收集整理临床科研一体化系
目的:观察蒙药地格达-4味汤抗D-氨基半乳糖胺(D-GlaN)和四氯化碳(CC14)致大鼠急性肝损伤及大鼠肝星形细胞损伤的保护作用,并分析其在急性肝损伤状态下大鼠体内血清、尿液及组织中移行成分;筛选地格达-4味汤抗急性肝损伤作用的药效物质基础。方法:(1)以D-GlaN和CC14建立大鼠急性肝损伤动物模型,从血清指标及病理组织学角度评价地格达-4味汤对大鼠急性肝损伤的保护作用。(2)采用高效液相色
目的:癌干细胞(CSC)也称为肿瘤干细胞,它的发现使人们对肿瘤的发生发展有了全新的认识。根据癌干细胞理论,结直肠癌干细胞可能来源于正常肠干细胞的突变。所以,通过确定细胞的起源(来自的干细胞或祖细胞),可以间接确定癌干细胞的来源;通过癌干细胞表达特异性标记物的研究,可以确定癌干细胞存在的部位及数量;通过研究癌干细胞在结直肠癌中表达的生物学特点及其临床病理特征与预后的关系,可以为特效药物筛选靶向治疗和
为了研究管道沟槽回填区与道路结构的变形协调性,开展了雨水管道沟槽回填泡沫轻质土变形协调现场试验;研究了回填泡沫轻质土分别与HDPE管道及沟槽周土体的变形协调特性;分析了沟槽回填及路基填筑过程中,垫层与基层、泡沫轻质土与管道及管槽界面的相对位移发展趋势。结果表明:回填泡沫轻质土与沟槽结合紧密,但回填区与HDPE管顶、基层与垫层之间可能发生脱空;管顶实测最大脱空量不超过4.00 mm,后续设计可选用较