视觉感知模型与编码算法研究

被引量 : 17次 | 上传用户：janbchang

【摘要】

：

视觉感知与编码是神经计算科学研究的基本问题之一,其主要任务是以神经生理学和认知科学的研究成果为基础,模拟人类视觉信息处理的神经模式,从计算的角度研究新的计算原理和

【作者】

：

杨文璐

【发表日期】

：

2008年01期

【关键词】

：

视觉感知神经编码时空特征提取内容和运动感知人脸视角感知独立分量分析张量分解自然梯度视觉皮层感受野

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

视觉感知与编码是神经计算科学研究的基本问题之一,其主要任务是以神经生理学和认知科学的研究成果为基础,模拟人类视觉信息处理的神经模式,从计算的角度研究新的计算原理和视觉信息处理系统。视觉信息处理机制和计算原理的研究不仅对揭示神经计算原理、建立新型计算模型具有重要的理论意义,而且对推动新型信息技术的发展,如人工视觉系统、失明患者的视觉功能修复、机器认知、新型人机交互模式等也具有重要而积极的作用。另外,在模式识别、身份验证、安全监控、智能的人机交互界面等领域也有广泛的应用前景。本文从稀疏编码的思想出发,以自然图像或序列作为训练数据,学习初级视皮层中简单细胞和复杂细胞的时空感受野及其自组织拓扑图,进而在较高级视皮层层次构建视觉感知模型来感知外界图像刺激中的内容信息、平移、旋转、缩放等运动和变换信息。本文的主要贡献和创新点体现在以下几个方面:为表征自然图像的统计特性,引入独立分量分析方法,以线性生成模型作为表征模型,从自然图像中学习图像基函数,这些基函数具有局部化、朝向性及带通滤波性,与神经生理实验发现的初级视皮层简单细胞和复杂细胞的感受野特征类似。由此得到的独立分量系数可作为神经元的响应,其概率分布满足稀疏性和超高斯分布,通过引入相邻神经元响应的二阶相关性,推导出基于自然梯度的自组织学习算法NGTICA,从自然图像中学习得到简单细胞感受野的空间拓扑结构。针对提取时空特征问题,提出一个基于视皮层不变性表示的时空特征提取模型。对NGTICA学习算法进行扩展,得到适用于该模型的时空基函数学习算法STICA。该模型可从具有时空结构的自然图像序列和视频序列中提取相应的平移、旋转、尺度变化、视角变化等时空特征。进一步研究了以这些时空特征作为复杂细胞感受野时,神经元的响应具有稀疏性和超高斯性。为感知外界刺激中的内容和平移运动信息,我们对视觉系统中的what和where通路建模,提出了一个三层的内容与平移运动感知模型,并给出内容感知算法OPA和平移感知算法TPA。初步的实验结果表明,用理想刺激加入不同噪声生成外界刺激,该模型可以感知到其中的朝向信息及平移运动方向和运动速度等。提出的感知模型及感知算法具有良好的鲁棒性。提出一个旋转运动感知模型,用于解决刺激序列中的旋转变换信息感知问题。以神经元响应的相关度作为不变性衡量指标,提出了旋转运动感知算法RPA。通过深入研究,我们把该模型提升为一个运动感知的泛化模型。当给定不同的运动时空基函数作为神经元的感受野,该泛化模型就可以特化为感知某种运动信息的模型。人脸视角估计是人脸识别任务中的一个重要预处理步骤。为解决人脸视角估计问题,我们从视觉感知机理出发,提出一个全新的基于独立分量分析的人脸视角感知模型。首先将STICA学习算法应用到多视角人脸数据集,得到多视角人脸基函数,作为神经元感受野。应用神经元发放率统计方法,提出人脸视角感知算法,并得到较好的感知实验结果。对神经元的响应进一步分析发现,对不同视角的人脸刺激,神经元的响应在高维空间中具有流形结构。这一结果为感知算法的成功应用奠定了良好的理论基础。考虑到人脸图像受光照、表情、视角、年龄等多种因素的影响,我们用张量分解方法同时提取人脸图像中的多因子表征,进而构建一个基于张量分解的人脸视角感知模型。以张量基空间表征与视角因子的相关性作为度量指标,提出了相应的人脸视角估计算法,得到的结果优于基于独立分量分析的方法。

其他文献

YICT推进六西格玛管理的策略和方法研究

作为重要的物流枢纽,码头当前面临着国内外需求萎缩和企业内部管理有待提升的巨大挑战,通过引入六西格码可以指导企业消除有缺陷的过程,产品和服务,从而达到提升绩效的目的。

学位

六西格玛六西格玛推进码头行业

中药材灵芝品种及其临床应用

期刊

中草药学中药材多孔菌科植物

高职院校英语专业学生创新创业能力调查分析

文章通过网络问卷调查的方式，对珠海地区高职院校英语专业学生的创新创业教育以及创新创业能力情况进行分析，然后提出有针对性的应对措施，以提高高职院校英语专业的人才培养质量

期刊

高职院校英语专业学生创新创业教育能力培养

地中海贫血基因诊断和产前诊断的研究

目的运用多重PCR技术（mPCR）和聚合酶链反应一反向斑点杂交法（PCR-RDB）,建立稳定、快速、准确检测常见α珠蛋白基因和β珠蛋白基因突变的常规诊断方法,探讨基因诊断和产前诊断在地

学位

α地中海贫血β地中海贫血基因诊断产前诊断基因型

高校研究生素质教育评估系统研究

随着世界高等教育事业的全面发展,高等教育已从社会的边缘走向了社会的中心。在高等教育规模不断扩大的背景下,如何保障和提高高等教育的办学质量成为各国高等教育界和社会各

学位

高等教育评估高校研究生素质教育评估指标体系评估方法

基于细菌群体趋药性算法的配电网开关优化配置研究

配电网开关配置是配电系统规划的重要组成部分,在配电馈线上配置一定数量的开关设备是提高供电可靠性的有效措施。科学、合理地配置开关设备,可获得巨大的经济效益和社会效益

学位

配电网开关优化配置智能优化细菌群体趋药性算法

机织物组织点自动识别的研究

传统的织物生产过程主要依靠人工检测进行来样分析,分析效率较低。将数字图像处理技术应用于织物结构参数的自动识别,改变了纺织行业中传统的手工操作流程,大大提高了工作效

学位

机织物组织点自动识别图像校正组织图

琴与鹤的文化意蕴——谈高罗佩《琴道》中的琴鹤关联

古琴在中国源远流长,深受历代文人喜爱,并成为极具中国文化代表的一个音乐器物,它的魅力亦征服了外国友人高罗佩。高罗佩一生酷爱古琴,其《琴道》一书更是全面而系统的阐述了

期刊

古琴鹤关联意象

五芳斋的典故

期刊

五芳斋沈大成

苏南高校大学生健美操认知与行为的调查研究

近年来,健美操项目以其独特的锻炼方式、良好的健身、健心效果而广泛流行。同时,在高校中也深受学生喜爱。大学体育教学很重要的一个目标是培养学生掌握科学的体育锻炼方式和

学位

苏南高校大学生健美操认知行为

视觉感知模型与编码算法研究

其他学术论文