概率图上的流形学习

来源 :浙江大学计算机科学与技术学院 浙江大学 | 被引量 : 0次 | 上传用户:ncwu521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对训练数据的建模是机器学习中的一个核心问题,本文将数据建模的两种经典方法——流形学习与统计学习作了结合,相互取长补短。在我们之前一些相关工作的基础之上,本文基于黎曼流形等方面的背景提出了一个完整的理论框架,设计了两个互补的优化算法,并通过大量的收敛性证明,凸性分析,以及计算复杂性等分析,将算法的外沿和应用范围作了极大的拓展,同时本文还设计了一套高效灵活的通用概率推断引擎,称为YASIE(Yet Another Statistical Inference Engine),使得所有这些方法可以用类似搭积木的方式进行自由组合。在此基础上,我们给出了这些方法和工具应用在两个经典的机器学习问题上的实验结果。对于训练数据大部分没有标记的半监督学习,本文总结的方法能取得尤其好的效果,相关的工作发表在ACMMultimedia,IEEE TKDE等国际一流会议和杂志上。流形学习是假定训练数据的本征维度比它们实际的维度要小很多,可能出现的数据分布在其所在高维空间中的一个低维的子流形上。而流形学习的任务是要用给出的有限个样本来推测流形的结构,计算并逼近一些对应的真实流形相应的几何性质,如低维子流形嵌入,切空间,拉普拉斯算子等。现有的流形学习通过在样点数据之间建立一个邻接关系图,并由这个图的结构诱导出一个用于优化图上每个节点的标记的目标函数。它的特点是高度非参数,对于数据间的结构的把握高效精准,恰到好处,并且常常可以证明用图结构离散地计算得到的结果在样本数足够多时能收敛到连续的情况。但它的问题在于应对多模态,具有复杂数据结构的输入训练数据时,显得力不从心。数据的结构上的关系不能得到有效地建模,并且很难应用先验信息。此外,为适应动态变化的数据而提出的在线学习的需求常常很难用流形学习得到满足。另一方面,统计学习通过使用具有一定分解形式的联合概率分布来建模给出的数据,得利于统计学深厚的积累,对于上述流形学习所遇到的问题能有比较好的解决方案。但它的问题在于模型通常是高度参数化的,它能否很好地拟合给出的数据依赖于参数形式指定地是否准确,对于数据分布在比较复杂的流形上的情况,同样捉襟见肘。本文从两个不同的途径结合两种学习方法,一种是把流形学习诱导出的目标函数添加到统计学习的优化准则中,作为一个正则项。本文大部分成形的工作基于这个思路。另一个途径是用统计学习的一个基本工具一一概率图模型,直接去建模用于流形学习的邻接关系图,使得它所反应的概率依赖关系在概率图上得到直接的表达,从而更自然得融入到原有的统计学习中去。并且我们可以证明:(ⅰ)部分流形正则项可以用一定形式的概率图表达;(ⅱ)部分概率图表达的邻接关系图可以用一定形式的流形正则项解释。相关工作还在探索中。
其他文献
家庭基站子系统(HNS, Home NodeB Subsystem)提供一种低成本的室内覆盖方案,能够满足高速率、灵活服务的数据业务及高效接入的需求,可以有效降低无线接入网在网络建设、运营
随着科学技术和IT技术的高速发展及广泛应用,改变了传统在时域和空域的限制性。然而,IT技术的快速性、高效性、社会性及国际性等特点,使得人们在交流中共享数据的同时也带来
基于IPv6的切换技术是影响移动IPv6服务质量的主要元素。针对现有移动IPv6切换延迟大、分组丢失率高问题,本文提出一种基于信息交换的层次型快速移动IPv6切换(NF-HMIPv6)机制
伴随网络通信技术的快速发展,网络通讯速度得以大幅度提升,为基于大数据量的桌面图像网络远程控制带来契机。近年来远程控制软件发展迅速,功能越来越强大,但是设计思想上和技
框架技术是很重要的软件重用技术,传统的开发模式已经不能满足大型Web应用系统的开发需求。Web应用框架可以提高Web应用系统开发的效率,虽然这在一定程度上限制了开发人员的
随着云计算的快速发展,学术界、工业界能够方便地获取较为低廉的计算、存储、网络等服务。然而,为云计算服务提供支撑的数据中心的正常运行需要消耗巨大的能耗值,随之带来的对能
随着计算机网络技术与多媒体技术的发展,远程教育已经成为改革开放传统教育模式的强大动力和有效手段。它突破传统学校教育方式的时空束缚,与课堂教育、广播教育、电视教育共
随着互联网的快速发展和网络技术的不断进步,一种基于移动Agent的分布式计算模式成为研究的重点。现阶段移动Agent系统并没有完善的安全保障机制。因此,安全性不足阻碍了移动
为了应对客户需求和相关政策的经常变化,提高市场竞争力,企业需要经常修改业务流程,这将耗费大量的资金、人力和物力。业务流程局部的修改会涉及到整个业务流程的配置,不合理的变
人脸识别因其在安全验证系统、信用卡验证、医学、档案管理、视频会议、人机交互、公安系统(罪犯识别等)等方面的巨大应用前景而越来越成为当前模式识别和人工智能领域的一个