【摘 要】
:
扩展卡尔曼滤波(EKF)算法作为同步定位与建图(SLAM)算法中的关键部分,被广泛地应用于智能机器人的定位、建图和路径规划中。然而EKF算法的高计算复杂度影响着最终定位和建图的速度,从而影响整个机器人系统的执行效率。尽管现有的相关工作提出了一些EKF硬件加速方案,但是现有的工作未考虑到EKF算法中矩阵的数据特性和矩阵乘法的多样性与特殊性,导致运算量大、加速范围有限和吞吐率低等缺点。针对现有工作的这
【基金项目】
:
国家重点研发计划“智能机器人”重点专项(2019YFB1310001); 中央高校基本科研业务费专项资金(2019KFYXJJS049);
论文部分内容阅读
扩展卡尔曼滤波(EKF)算法作为同步定位与建图(SLAM)算法中的关键部分,被广泛地应用于智能机器人的定位、建图和路径规划中。然而EKF算法的高计算复杂度影响着最终定位和建图的速度,从而影响整个机器人系统的执行效率。尽管现有的相关工作提出了一些EKF硬件加速方案,但是现有的工作未考虑到EKF算法中矩阵的数据特性和矩阵乘法的多样性与特殊性,导致运算量大、加速范围有限和吞吐率低等缺点。针对现有工作的这些问题,本文通过深入分析和研究EKF算法及EKF算法中的矩阵乘法,提出了基于可重构矩阵乘法硬件加速器的EKF硬件加速系统设计。本文从EKF算法级、EKF硬件加速系统的架构级和可重构矩阵乘法硬件加速器级三个层面进行创新设计。在算法级,提出了利用EKF算法中数据对称性的方法、利用数据稀疏性的方法、优化的矩阵乘法计算顺序以及利用数据等效性的方法,以充分利用EKF算法中矩阵的数据特性,减少运算量。在EKF硬件加速系统的架构级,提出了以可重构矩阵乘法硬件加速器为核心模块,矩阵求逆模块、矩阵加/减法模块、求偏导函数模块、矩阵拼接模块和预测/测量函数模块为协同计算模块的系统架构,实现了更广的加速范围。在可重构矩阵乘法硬件加速器级,在充分考虑EKF算法中矩阵乘法多样性和特殊性的基础上,提出了高效的数据存储策略和可重构数据流设计方案,减少了存储开销,提高了EKF算法中矩阵乘法的吞吐率和硬件利用率。通过在EKF-SLAM系统级对本文算法级的创新设计进行验证,本文相比目前最先进文献工作,减少了EKF中27.4%的矩阵乘法运算量,减少了EKF-SLAM算法17.7%的计算时间。本文基于ALINX(AX7Z100)FPGA开发板对所提硬件设计进行了验证与评估。FPGA上板实现结果显示:硬件资源开销为13598个LUT、2371个FF、88个LUTRAM和30个DSP,最高工作频率为54 MHz。性能评估结果显示:相比目前最先进文献工作,本文设计能对EKF算法中所有矩阵乘法进行硬件加速,且减少了86.7%的存储开销,实现了更高的吞吐率(2倍),实现了高达99.89%的硬件利用率。此外,本文还基于GPDK045数字工艺库对所提设计进行了面向ASIC设计的逻辑综合,结果为:硬件资源开销为74038个门单元,面积为0.336 mm~2,最高工作频率166 MHz,总功耗15.354 m W。
其他文献
RS码凭借其优异的纠随机错误和突发错误能力,已经成为以太网通信系统常用的差错控制方式之一。在实际生产应用中,如何能快速有效地对RS编译码电路功能进行测试;在电路因为受到外界环境等因素的干扰而导致电路状态发生异常时,如何在不进行系统复位(系统复位会极大影响业务的进度)的情况下恢复电路功能,这些都是在实际生产中需要面临和解决的问题。在常规编解码器的基础上,本文设计了一款可自检测和自恢复的RS编译码器,
刮板输送机中刮板链是容易出现故障问题的结构件之一,对其张力进行监测是提升其运行稳定性和可靠性的有效手段。以SGZ764-400型刮板输送机为对象,建立了刮板链的张力监测系统,主要由3部分构成,分别为张力采集装置、数据接收装置和接近开关。选用CC2530作为无线网络的射频芯片,对采集的张力数据进行无线传输,利用应变片模块采集的张力数据需通过放大模块和滤波模块处理后再通过I/O接口输入到CC2530芯
时空观念是在特定的时空联系中对事物进行观察、分析和思维的方式。时空观念不仅在诸历史学科核心素养中居于基础地位,而且是历史学科的本质体现。史料是人们认识过去的重要工具,新课程标准也指出,史料实证是诸素养得以达成的必要途径。所以,运用史料来培养学生的时间观念是落实历史学科核心素养的必要途径。基于此,本文试图运用史料来培养学生时空观念的核心素养,以期丰富时空观念核心素养的培养策略,进而促进历史学科五大核
嵌入式摄像头在情报侦测,医学检查,安防监控等领域均有广泛的应用。一些场景下,不可避免的机械震动会导致视频不够清晰,影响视频中信息的质量,因此摄像头视频数据的稳像技术在当今显得尤为重要。电子稳像由于其体积小,功耗低,效果好等优点成为了当今嵌入式应用的主流稳像方案,其中基于SURF特征点提取的电子稳像由于鲁棒性高等优点而受到重视。但原始SURF算法复杂度较高,软件实现实时性较差,其描述和匹配结果的准确
随着量子计算技术的高速发展,传统公钥密码体制将面临量子计算机攻击的安全威胁,将现有加密技术过渡到能抵御抗量子计算机攻击的后量子密码(Post-Quantum Cryptography,PQC)技术正成为国际密码学理论与技术领域的研究热点。在现有的PQC方案中,基于格问题的密码方案由于其结构简单、速度快、安全性高等特点,成为了最具潜力的新一代密码安全方案。本文研究的Saber算法具有公钥长度短、易于
厌氧氨氧化工艺由于低能耗、无污染且经济效益好等优势,使其在污水脱氮中具有较好的应用前景。但厌氧氨氧化系统在处理实际污水时会受到有机物的影响。适当浓度的有机物能够提高系统的总氮去除率,然而实际污水中的有机物种类较多,既包括挥发性脂肪酸等易生物降解的有机物,也包含腐殖酸等难生物降解的有机物。不同种类的有机物对厌氧氨氧化系统产生的影响也不同。因此,本研究分别选择丙酸盐和腐殖酸作为易生物降解和难生物降解有
脑机接口(BCI)能将受试者意图相关的大脑活动转化为外部设备控制指令,在神经疾病治疗、运动康复等方面具有较高应用潜力。BCI的实现需从人脑获取有意义的信号,而脑电图(EEG)可以反映神经电活动,主要用于对反应实时性要求较高的BCI系统;近红外光谱(NIRS)主要反映血流动力学水平,一般用于神经生理状态等需要精确定位脑活跃区域的研究。EEG和NIRS因其非侵入、方便穿戴、成本较低等优点,成为BCI的
以花园大道隧道工程总体设计为例,通过对区域路网规划解析,分析花园大道交通功能,论证项目建设的必要性。总体设计公园总体规划的要求和现状建设条件,意在探求在城市隧道设计在线形及洞口位置、隧道进出匝道布设、双层立交隧道、“管幕+顶进”工艺的构思理念,为以后类似项目提供借鉴。
<正>随着无线通信新技术不断涌现,传统以频率为主的电磁频谱监测模式已无法满足快速识别和处置无线电干扰的要求。本文设计一种基于机器学习的无线电信号智能识别系统,以实现更快速、更准确、更智能的无线信号采集、处理和分析诊断,突破传统无线电信号发现和识别的性能瓶颈,构建频谱大数据存储和云计算平台,打通行业数据孤岛,实现高精度、智能化的信号诊断分析。