平移不变度量的理论与应用研究

来源 :北京大学 | 被引量 : 0次 | 上传用户：lygzzm

【摘要】

：

确定或选择某种距离度量是模式识别、机器学习和聚类分析等研究中的一个核心问题。例如，选择一个优良的距离度量，对于很多计算机视觉领域的问题(如图像分类、基于内容的图像检

【作者】

：

孙冰

【机构】

：

北京大学

【出处】

：

北京大学

【发表日期】

：

2009年期

【关键词】

：

距离度量平移不变度量图像分类算法度量设计度量学习变换域模式识别机器学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

确定或选择某种距离度量是模式识别、机器学习和聚类分析等研究中的一个核心问题。例如，选择一个优良的距离度量，对于很多计算机视觉领域的问题(如图像分类、基于内容的图像检索等等)是非常重要的。而直接基于样本距离的一些算法，如k均值聚类(k—means)、k近邻分类器(k—NN)等，其正确率更是决定于所选择距离度量的性能。　　常用的距离度量，例如欧式距离、闵可夫斯基距离等等，它们与训练集和领域知识完全独立，并没有利用问题特定的信息。而在模式识别和机器学习等这些特定的领域中，所要求的度量常常可以从训练集上学习得到，也可以通过对特定或一般数据集上的先验知识、设计准则来指定。前者即所谓的度量学习问题，在最近几年得到了很大的关注和发展；而后者(可以称为度量设计问题)则常常是一个更为困难的问题，这是由于“先验”的知识和准则通常很难获得、表达和验证。　　图像欧式距离(image Euclidean distance，IMED)和广义欧式距离(generalizedEuclidean distance，GED)是一族重要的图像距离度量。各种实验和应用证实了这两种度量在大量实际问题中都使得性能得到提升。实际上，IMED和GED属于一类更广泛的距离度量：平移不变(translation invariant或者shift invariant)度量。平移不变陛是任意一个直观上合理的图像距离的必要性质。　　 IMED和GED可以通过线性变换嵌入到大部分图像分类算法中去，其相应的变换分别称为标准化变换(standardizing transform，ST)和广义欧式变换(generalized Euclidean transform)。然而，ST和GET都不是平移不变变换。由于平移不变变换在理论和实际应用中都具有十分巨大的意义，有必要研究它们之间的关系。　　本文对平移不变度量的理论基础和应用进行了研究，解决了平移不变度量与变换之间关系的理论问题，并提出了几种新颖的算法。本文的主要贡献如下：　　 1.我们为每一个平移不变度量都显式地构造了相应的平移不变变换。在此基础上，我们试图给出IMED和GED在模式识别应用中能取得有效结果的理论基础。在给出平移不变度量与变换关系的过程中，我们提出了度量滤波器的概念。通过度量滤波器这一理论工具，我们证明了任意平移不变变换诱导了输入空间上的一个平移不变度量度量；反之，任意平移不变度量等价于一个平移不变变换后的欧式度量。　　 2.度量滤波器的引入不仅为我们在变换域上考虑度量问题提供了可能，也可以提高计算的时空效率。我们提出了IMED的一种快速实现算法，使得空间复杂度从O(n2/1n2/2)下降到O(1)，时间复杂度从O(n2/1n2/2)下降到O(n1n2)。　　 3.我们研究了变换域上的度量设计问题。我们以IMED为例进行了空域/频域上的度量分析，并根据分析结果为USPS手写数字图像库设计了一个度量滤波器(也就是一个平移不变的二阶度量)；我们设计的度量比IMED的分类能力要好，体现在比较一致的性能提升和更好的鲁棒性。　　 4.我们研究了变换域上的度量学习问题。从度量的频域视角出发，我们提出了一个新颖的度量学习算法TDML(transform domain metric learning)，来进行平移不变的二阶度量学习。TDML试图同时最小化平均类内距离和最大化平均类间距离，这一判据Xiang等人提出的XNZ算法比较相似。相较于XNz算法，TDML以5～10倍的计算效率，提供了可与XNZ相较的识别正确率，而在小训练样本数量的情况下，TDML，的识别率非常显著地优于LDA、XNZ和SVM等算法。

其他文献

诗心画意

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

诗心画意

修订《事业单位财务规则》的相关认识

本文从当前我国事业单位财务管理现状中存在的财务管理制度不够健全、预算管理不足、财政收支两条线改革力度不够及固定资产需要进一步规范等问题入手,对《事业单位财务规则

期刊

事业单位财务管理预算管理体系框架

短波频谱感知技术研究

随着短波电台用户的越来越多,以及敌意干扰的不断发展,无论是短波自组织网络内的节点通信,还是使用短波接入网的网间通信,都面临着巨大的挑战。认知无线电技术的提出为解决短

学位

认知无线电频谱感知能量检测短波ALE技术接入网策略

准噶尔盆地羽毛三芒草（Aristida pennata）种群遗传结构的研究

本研究以生长于古尔班通古特沙漠优秀固沙禾草羽毛三芒草(Aristida.Pennata.tirn)为研究对象，在阜康，147团及121团周边等7个亚种群采集76个样品，通过RAPD分子标记技术进行亚种群

学位

羽毛三芒草植物种群RAPDSSR遗传变异遗传多样性

分形理论在网络流量建模中的应用研究

网络流量建模对网络性能分析和优化网络资源配置等有重要意义。自上世纪90年代以来，网络研究者普遍认为网络流量是自相似性（长相关）的，传统的泊松模型会导致过于乐观的网络性能估

学位

分形特征分形特征网络流量网络流量建模分析建模分析Hurst参数估计Hurst参数估计层叠模型层叠模型

重构事业单位财务规则体系的几点思考

随着国家财政和各项社会事业改革的深入开展,2012年出台的《事业单位财务规则》已经难以适应改革和发展的需要.为了充分体现党和国家各项方针政策的宏观要求,有效推动事业单

期刊

重构事业单位财务规则

刺激隐核虫（Cryptocaryon irritans Brown 1951）生物学特性的研究

　　刺激隐核虫(Cryptocaryonirritans)是一类周身遍布纤毛的纤毛虫，感染寄生多种热带、亚热带海水硬骨鱼，引起“海水鱼白点病”，由于近年来海水鱼类养殖集约化的提高，刺激隐核虫

学位

刺激隐核虫纤毛虫白点病温度盐度干燥处理药物防治卵圆鲳鲹

第十九封信:有国徽的城楼——致花海

感谢你的娇艳,和最专心的爱,一如感谢那些仰视我的人群.rn我嗅到花瓣的新鲜香气,花蕊的雨露清润,我听得见枝枝叶叶的言语,一如我见过最纯真,最年轻,最聪慧,最奋发向上的人群.

期刊

基于SDR平台数字前端技术的研究与设计

在无线通信中,由于各种通信系统采用的体制、标准和实现的功能存在差异,使得相互之间的通信存在兼容性差、互操性差、资源浪费等问题。在数字通信的基础上发展起来的软件无线

学位

软件无线电数字前端多速率信号处理ISOP滤波器

基于龙芯Ⅱ号平台的中文拼音输入法优化

针对目前龙芯平台上Linux中文操作系统的需求，本文研发了以SCIM为架构的中文拼音输入法，并根据龙芯处理器的体系结构进行优化。文章深入分析了龙芯处理器的体系结构、SCIM输入

学位

龙芯2号中文输入法软件预取中文操作系统自学习功能模块

平移不变度量的理论与应用研究

与本文相关的学术论文