论文部分内容阅读
回归模型是一种通过样本学习数据之间的复杂关系,并利用学习到的关联关系进行预测的数学模型,已被广泛应用于计算机视觉领域中的图像分类、目标检测等方向。然而,为了实现越来越好的检测或分类效果,回归模型的复杂度不断增加,带来了计算量的急剧增加以及对训练样本更加苛刻的需求。一方面,为了提升效果,大量的特征被引入学习模型,各个特征在学习模型中的作用却不得而知。过多的输入特征不仅使得运行效率降低而且增加了过拟合的风险,同时少数有效特征的作用也会被掩盖在许多无用特征之下。另一方面,基于深度神经网络的回归模型的学习过程严重依赖于参数调节,导致其在数据样本不均衡、有效样本较少等情况下难以应用。从这两方面出发,本文首先从计算机的角度模拟视觉注意机制,通过不同的特征选择方法分析不同的特征和特征组合对视觉注意的影响。然后,针对小样本图像数据集问题,从提高特征表达学习能力、减小计算量、降低调参的依赖度入手,借鉴了决策树的构造思想,研究了基于决策森林的级联回归模型,并构建了目标检测系统。主要的研究内容包括:1.针对视觉显著性预测问题,基于特征选择方法分析了各个特征对显著性预测的作用。基于构建的一组候选特征集进行的实验表明,常用的大部分底层特征是冗余的,而对注意力来说,中层特征比底层特征有更强的指导作用。2.针对传统决策机制无法均衡当前最优与全局最优的不足,提出了 一种以“概率”决策机制构建概率决策森林(Probability Decision Forest,PDF)的方法。利用局部描述码本(Local Distribution Codebook,LDC)来提高特征表达学习的能力;利用概率函数控制节点分裂数据的走向来构造概率决策树,从而将目标检测问题转化为求解概率模型的最优解,避免了非极大值抑制并实现了多目标同时检测和定位。3.针对基于深度神经网络的回归模型存在的两个问题:①参数众多,学习性能严重依赖于调参,且参数设置通常依赖于经验;②为获得最佳学习性能通常采用较低的学习率,从而导致模型收敛的时间长等不足,建立了一种基于决策森林的级联回归模型(Cascaded Regression Model Based on Decision Forest,CRMDF)。该模型仅有6个超参数,极大地降低了对调参的依赖性,提高了模型的收敛时间,改善了传统深度神经网络处理小样本数据的能力。4.针对CRMDF在特征表达学习能力上的不足,提出了一种将PDF与CRMDF结合以提高特征表达能力的方法,并设计了 一种新的投票组合权重方法用以约束LDC对不同学习目标的贡献,使得模型在样本不均匀的情况下也能够快速收敛。