图像识别中图像表达的关键技术研究

被引量 : 0次 | 上传用户:gongshan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物体和场景识别在基于内容的图像检索,自主机器人导航,医学图像分类等领域有着广泛应用。本文从近些年视觉认知的主要进展出发,对认知中的关键技术进行了探索,力图进一步提升认知准确率。经典的物体、场景识别可以分为特征描述和特征判别两个部分,前者力图得到关于物体的最具判别意义的表达,而后者通过对训练样本的学习,得到不同类别判决函数的计算模型。同样,这一框架也适用与视频目标的自组织识别。然而,视频目标具有其独特特性与挑战:?视频中目标特性往往经历长期渐变的过程,故而其特征也必然经历这一变化过程。这就要求对于特征有效性的分析必然是一个递进的过程。?视频中目标往往伴随场景出现,即目标和背景具有很强的相关性。如何利用这一相关性,提高识别性能,也是面临的挑战之一。然而现有物体识别方法性能与人类相比仍然有着巨大的差距,研究表并没有证据表明人类模式识别的算法比标准机器学习算法优越,并且人类并没有过多依赖于训练数据的量的大小,故而影响人类认知精度的关键可能在于特征的选择。事实上,相对于特征判别的学习方法,特征描述在物体识别的性能中起着更加重要的作用。为此,研究重点之一集中在如何有效描述视频中目标特征这一问题上。一方面,目标特性的渐变要求建立目标特征的在线评价机制:特定特征可能仅仅在特定时间段内有效;另一方面,目标与场景的相关性,可以通过场景全局特征与目标局部特征的混合表达实现。研究以词袋模型为起点,将高维特征视为一维特征的叠加,进一步将一维特征视为未知概率分布的观测。故此,特征有效性的在线评价转化为概率密度的在线估计和比较问题。借鉴了蒙特卡洛方法的思想,实验采用混合高斯模型逼近该概率分布,以KL距离为主要度量方式,从互信息的角度将特征递推的认知过程分析分为特征的鲁棒性分析和对决策结果的影响分析,初步探索了在线特征评价模型。在特征评价机制的基础之上,研究过程中,仔细对比和分析不同特征描述模型的优缺点,设计了基于混合表达的视觉认知模型。该模型分别对场景全局特征和目标的局部特性表达进行了融合,进一步挖掘了场景与目标特性的相关性,实现了视频目标的在线自组织识别过程。文章结尾展示了初步探索结果,并对其深入分析。
其他文献
信号在获取和传输的过程中由于信号发生器、传感器等设备会受到噪声的干扰,因此,实际应用中获得的信号大都是含有噪声的。对含噪信号直接处理会影响到特征识别、分类等后续处
创业投资是适应现代科技发展需要而在高度发达的市场经济体制内诞生的一种投融资制度创新,它在促进科技成果向现实生产力转化方面具有重要的作用。生物医药产业是一个高新技
随着视频、通信、计算机等技术的不断进步,视频监控技术越来越多地应用到社会管理之中。视频监控系统24小时不间断地采集大量的信息,这些信息为打击违法犯罪提供了有力的证据
<正>提起芭蕾,柴可夫斯基的《天鹅湖》一定是在世界范围内知名度最高、影响力最大、演出场次最多的芭蕾舞剧。正因如此,电影《黑天鹅》自上映以来,就受到观众的追捧。而本片
背景与目的:华蟾素注射液是传统抗肿瘤中药制剂,目前药效机制尚不明确。本研究旨在探讨华蟾素注射液对DNA拓扑异构酶Ⅰ(topoisomerase Ⅰ,TOPOⅠ)的影响。方法:采用噻唑蓝还
传媒与司法权威间的紧张关系实质上体现的是法律的自治品格与司法裁判的权威合法性根基之间的张力。本文透视道德与法律,事实与规范的互动定位,在深度考察和全面概观中国传统
针对湘东北雁林寺地区金矿是否存在矿源层、NE向劈理化带和NW向韧性剪切带对金矿的控制作用及其成矿时代等争议性问题进行野外调查和室内分析,研究结果表明:(1)金矿的矿源层
目的探讨PI3K/Akt信号在β样淀粉蛋白(Aβ1-40)引起的PC12细胞凋亡中的作用及依达拉奉(MCI-186)对其影响。方法采用流式细胞学检测细胞凋亡,Western blot法检测磷酸化Akt及总
<正>进入21世纪以来,集艺术、文化、政治、经济、宗教、技术等一体的以声画结合为特征的电影艺术得到更大发展,为观众提供愉悦性的感官享受,成为大众文化的代表之一,也成为当
本文在顾客满意度基本理论、结构方程模型理论和顾客满意度指数测评进行分析的基础上,构建了顾客满意度测评的常规模型和拓展模型;给出了PLS算法求解的方法和步骤;提出了对网