论文部分内容阅读
动态纹理识别是计算机视觉领域的核心问题之一,广泛地应用于军事和民事领域中。本文利用混沌特征向量对动态纹理进行描述,实现了动态纹理的准确识别。在对识别算法的研究中,本文设计了优化算法来提高识别效果。为了更好的描述动态纹理,本文研究了将低层特征通过深度学习得到高层特征的算法,并将动态纹理识别方法应用于智能交通流的分类。论文的主要工作和创新点有:1.针对动态纹理的建模问题,本文提出了用像素时间序列作为描述动态纹理的基本特征方法。该方法将像素时间序列看作一个整体特征向量,可以得到更多的时间信息。实验结果表明,像素时间序列对动态纹理具有一定的描述能力。2.针对像素时间序列中存在的自相似性,本文提出了用混沌特征来描述像素时间序列的方法。不同于以往用于计算机视觉领域的混沌特征向量。在动态纹理中,分形特性相当重要。本文提出的混沌特征向量是描述动态纹理的局部特征,经过词袋模型表示之后,能够较好的表示动态纹理,取得较高的识别率。通过实验表明,本文选择的混沌特征在识别效果上优于其它特征。3.针对词袋法出现的量化问题,提出了基于内容的动态纹理识别方法。该方法首先对每个像素时间序列提取混沌特征向量,然后对每幅视频分割,得到前景和背景。接着通过地球移动距离(earth mover’s distance,EMD)来比较两幅视频之间的相似性,来实现动态纹理识别。该算法可以用于交通视频流识别。4.针对常规的识别算法中,没有考虑特征之间的关系,本文提出了多任务学习方法来获取训练特征之间的关系,并用alternating direction method of multipliers(ADMM)优化算法来得到更高的识别率。本文给出的多任务学习模型,能够很好的获取多任务(特征)之间的共性信息和个性信息。同时ADMM算法可以很好的保证这个优化问题能够快速准确的求解。5.针对直方图特征的描述性不足,本文采用了深度学习方法,通过对大量数据的学习,得到更具有描述性的特征。本章提出的算法框架,通过将词袋法得到的直方图特征进一步学习得到高层特征,可以更好的用于动态纹理识别。