论文部分内容阅读
视觉是感知行为的最主要方式。视觉信息通常具有信息量大、维数高等特点。注意力选择机制在视觉感知的初期发挥了关键性的作用,帮助我们分析、提取视觉场景中感兴趣的区域和目标,在工程应用上有着良好的应用前景。但现有的视觉注意理论模型往往存在计算复杂、实验结果依赖参数选取等缺陷。这就导致其并不适用于诸如图像、视频质量评价等有较高实时性要求的工程应用。同视觉注意类似,行为抉择是生物另一项基本技能,是一个极其复杂的脑信息处理过程。人工智能领域的增强学习算法能够模拟生物行为抉择的学习过程。通过奖惩信号,不断试错,最后得到优化的策略。但传统的基于查找表的增强学习方式无法适应状态维数很大的情况,因此并不能很好的应用在视觉信息的学习上。针对上述局限,本文在以下几个方面进行了探索,主要贡献为:1.提出了一种频率域的快速获取图像显著图的算法。采用2D的fourier变换,然后将各频点上的幅度设为同一常数,保留其相位信息,对其反变换到空间域的图像滤波后,得到反映视觉注意力显著图。这种算法大幅提高了运算速度,其显著性提取效果也优于现有的注意力选择模型。2.提出了一种基于显著性的图像、视频质量评价方法。利用快速注意力选择算法计算参考图像和视频帧的显著图,将得到显著图看做权重来调节原有图像评价准则,对视频通过帧内和帧间的加权得到视频质量的评价,与现有方法的对比实验表明:我们的方法显著提高了质量评价性能,使其更接近人的主观评价。3.提出了一种模拟果蝇视觉-行为抉择的神经网络模型。该模型引入了价值和基于值的强化学习算法,应用于输入视觉图像的强化学习,以此建立果蝇脑内多巴胺和蘑菇体对于抉择判断的价值体系。该模型可以模拟果蝇视觉信息的学习和行为抉择过程,其结果与生物实验相符,同时也为视觉信息控制行为抉择的应用提供了基础。4.在3d汽车仿真平台上把注意力选择机制和强化学习进行结合,实现智能小车在未知环境下的基于视觉的自主驾驶,编写相应C代码。