论文部分内容阅读
传统上,一个信号常常可以用一组正交的基本信号的线性组合表示或者逼近。虽然这种表示在数学上较为优雅,但是在信号处理的实际应用中并不那么有效和高效。信号处理中,信号的紧缩表示常常是想要实现的目标。信号表示的这种稀疏性是通过增加基向量的数目将完备基变成过完备基才能取得。这种过完备的、冗余的基就是所谓“稀疏字典”。稀疏性最直观的度量是l0范数。基于稀疏字典,可以使用其原子的线性组合估计信号,稀疏表示问题实质上是稀疏约束下所测得的信号与估计信号之间的拟合问题。因此,研究信号和图像的稀疏表示从某种程度上就是要研究稀疏字典;稀疏求解也涉及到稀疏字典;稀疏字典的设计和构造理论也不是很完善;基于图像等高维数据的字典本身具有一定的特殊性,这些都是本文研究的原因和动机。本文主要研究稀疏冗余字典的设计原理和构造方法以及稀疏字典在稀疏求解中的应用。主要研究工作包括:(1)分析研究了当今图像的稀疏字典的设计原理,归纳出三类稀疏字典及其构造方法并预测了图像稀疏字典的发展趋势。通过分析稀疏字典的发展过程,从中找出当前图像的稀疏字典设计思想及其字典设计中所应该考虑的一些因素:局部性、多分辨率、自适应性、几何不变性及过完备性;同时根据当前字典的发展情况,将稀疏字典归纳成结构字典、联合基和学习字典,并且给出各类字典的基本构造方法。在此基础上,本文还分析当今稀疏字典设计和构造中的不足,并指出图像稀疏字典设计和构造需要努力的方向:所设计的稀疏字典应该使得图像的稀疏求解更为高效;所提出的字典应该具有不相干性等。(2)提出了稀疏贪婪索引字典并且设计了基于图像的稀疏贪婪索引字典的正交匹配追踪算法。考虑到原始的贪婪类算法采用完全搜索方案,涉及到大量向量与矩阵的乘法,计算代价过大。为了减少这种计算代价,许多改进的方案被提出来,也取得较好的效果。但是这些已有的改进方案主要是针对结构字典提出的,或者利用小波分解的层次结构,或者将字典原子的参数索引组织成基于树结构的参数字典,这些改进的方案对于非结构的学习字典是行不通的。针对这种情况,本文提出了稀疏贪婪索引字典:结合匹配追踪中贪婪匹配的特点,通过再学习找出学习字典的索引结构,同时给出学习字典的索引化算法以及基于所构造的索引字典的正交匹配追踪算法。本文还对算法中进行理论分析,相关的实验证明所提出的算法能够成倍提高了算法的时间性能。(3)提出了基于交替投影法构造图像的联合基的近似等角紧框架。紧框架是学术界比较看好的一类特殊框架,具有良好的数学性质。如果把冗余字典看作由一组列向量排列而成的矩阵时,其实质上就是框架。为了满足稀疏理论中唯一性和等价性的要求,需要对字典的列向量施以某种相干性的约束以构成所谓“不相干字典”具有等角紧框架性质的字典是天然的不相干字典。等角紧框架的构造方法有代数法、遗传算法。基于会议矩阵或者Gram矩阵的构造方法可以构造出严格的等角紧框架。代数上已经证明,并不是在任何情况下都存在等角紧框架。采用这种方法构造的等角紧框架并不是都能成功;而采用遗传算法构造等角紧框架则利用了计算机的计算能力能够有效地找出等角紧框架,当然这种方法局限于机器的性能。本文基于矩阵近似的思想,采用交替投影法构造联合基的等角紧框架,并给出构造实例。相关的实验结果表明:这种构造方法对于构造联合基的近似等角紧框架非常有效,所构造的近似等角框架能够高效地用于稀疏求解。(4)研究了图像的稀疏字典在图像的稀疏表示中的应用,分析和归纳了在稀疏表示中选择合适的稀疏字典所应注意方面。基于前面的有关稀疏字典设计和构造理论,本文阐述了图像的稀疏字典应用所应该注意的问题,特别是稀疏字典的选取问题,倡导在稀疏求解过程中采用学习字典,指出基于某种不变性的字典在图像信号处理中具有较好的发展前景,并结合图像分解讨论了字典的选取,相关实验表明在稀疏求解中合理选取字典的重要性。本文的研究成果有助于推动图像的稀疏表示理论和稀疏求解方法的研究、同时可以加快稀疏表示在信号和图像处理中的应用进程。