论文部分内容阅读
随着科学技术的发展,数字图像成为人们生活中不可或缺的重要组成部分,它在智能图像识别、信息安全、工业控制、医疗以及航空航天等各个领域中都有着重要的应用价值。图像处理是数字图像在各个领域发挥其价值的重要手段。图像处理依赖于高效图像处理算法的支撑。数字图像由于具有数据量大的特点,因此在实际应用中通常需要很大的带宽对其进行采集、传输和处理。这不仅增加了系统的成本而且满足不了实时应用的需求。为了降低图像处理系统的成本并且满足实时处理的应用需求,研究快速的图像处理算法便具有重要的意义。另一方面,随着半导体工艺技术的进步,芯片设计尺寸变得越来越小,因此在单块芯片上可以集成更大的系统,这就促使硬件化研究获得了越来越多的青睐。硬件化研究不仅是芯片设计的重要前提更是加速研究中的重要处理手段,其对实现图像算法的实时处理具有重大的现实价值。因此,论文针对图像处理中数据量大、处理耗时长以及成本高昂等问题,对图像处理中的相关算法进行了加速以及硬件化研究。这对实现图像处理造福于人类社会具有重大现实意义。图像处理包含了重要而广泛的应用领域,诸如图像压缩重构、图像增强等等。压缩感知近年来获得了广泛关注,它是图像压缩重构中的研究热点之一,其由于突破奈奎斯特采样频率的性质在自然图像以及医疗图像中获得了广泛应用。指纹图像增强是图像增强处理中的典型应用之一,其由于指纹唯一的特性近年来在生物安全领域获得了极大发展。然而,图像处理的前提是获取数字图像,这就离不开图像的采集。图像采集根据应用领域的不同包含了自然图像采集和生物图像采集等等。生物图像是人们生活中的一个重要方面,它包含了诸如超声图像、指纹图像以及其它的医疗图像等等。超声波束合成便是超声图像采集的一个重要途径。为了在图像处理的完成流程中(包括采集和处理)体现加速研究与硬件化的价值,论文以压缩感知、指纹图像增强和超声波束合成作为切入点,来分别反映出硬件化研究在图像重构、图像增强和图像采集中的重要作用和价值。论文以高效图像处理系统设计为目的,从算法和硬件的角度对压缩感知、指纹图像增强和超声波束合成进行了研究分析和系统设计。基本算术运算函数作为图像处理算法中的基础,对实现高效图像处理算法硬件架构具有不可或缺的作用。论文以图像处理中相关算法作为主要研究对象,以基本算术运算函数这一算法基础为出发点,研究了除法、开方、开方求逆以及反正切这几个基本函数的硬件化架构。在此基础之上,论文对图像处理中的图像重构、图像增强以及图像采集这三个重要应用领域的相关算法进行了分析研究,分别研究了快速压缩感知算法及其硬件架构、指纹图像增强算法硬件架构以及超声波束合成硬件架构。基于上述的研究内容,论文的主要工作及贡献如下:1)论文提出了基于子表达式共享技术的分段线性近似与牛顿法相结合的开方求逆硬件架构。针对传统基于查找表的方法在高计算精度下具有耗存储资源、收敛速度慢等不足,而牛顿法则具有复杂度较高、需要多次迭代才能达到所需精度等局限,论文结合分段线性近似和牛顿法的优点,在硬件结构上利用子表达式共享技术,实现了在较低资源下单次牛顿迭代便可以获得较高的开方求逆精度。此方法相比Altera提供的IP核在精度和吞吐量上具有优势。此外,针对图像处理中大量使用的除法和开方求逆函数,论文研究了不同尺寸的查找表以及不同的迭代次数对相关函数计算精度的影响。结合不同硬件架构面积、吞吐量和精度之间的比较分析,论文为其在图像处理中的应用指明了方向。2)论文提出了一种基于自适应测量和可分离线性重构相结合的压缩感知算法。压缩感知以其突破奈奎斯特采样率的性质获得了快速发展,低采样率使其具有压缩简单、重构复杂等特点。针对传统压缩感知重构算法耗时长等不足,论文对压缩感知中的压缩测量和重构算法进行了研究。文中提出的算法充分挖掘了图像在空域二维结构中的相关性信息,实现了依赖于方向的逐层重构。通过结合对不同的图像块分配不同测量率的自适应测量的方法,实现了在保证图像质量前提下的快速图像重构过程。3)论文提出了一种在处理时间上高效的压缩感知硬件系统架构。快速压缩感知算法虽然能加速图像的重构过程,然而,从实时应用的角度来看其依然具有局限性。针对压缩感知算法不能满足实时处理的需求,论文挖掘了压缩感知在硬件结构和时序调度上的并行特性,实现了对大尺寸块图像的实时重构处理。此外,论文提出了一种高吞吐量的Cholesky硬件分解结构。高吞吐量的性能是通过挖掘Cholesky分解内部并行计算特性和采用高性能的开方求逆硬件架构来实现的。4)论文采用总线及脉动处理技术提出了一种全硬件化的指纹图像增强系统架构。传统指纹图像增强算法不论是软件处理还是软硬件协同处理耗时都达到了秒量级,不利于指纹图像增强的加速处理。文中提出的硬件架构通过采用基于CORDIC方法的反正切函数以及迭代处理策略,实现了在资源面积较少消耗情况下对指纹图像增强算法的加速处理。相比软件处理及软硬件结合的处理方式,本文中的全硬件架构加速性能达到至少5倍以上,并且实现了对速度和面积的优化设计。5)论文结合合成孔径、纯净谐波和插值处理技术提出了一种基于单块低成本可编程逻辑器件的波束合成解决方案。波束合成的过程中需要同时处理大量通道的实时数据,针对传统方法在处理大量数据具有成本高昂等不足,文中提出低成本高帧率解决方案实现了在32个实际通道下对64个有效通道的波束合成并且满足了实时处理的要求。此外,通过采用协处理器设计,实现了对各个关键参数的动态配置,具有高度灵活性以及易于升级等特点。