论文部分内容阅读
现实生活中的数据有时会有多种表现形式,如图片、文本等,如果能够有效结合所有这些有用的信息可以取得更好的处理效果。在机器学习领域里这种有多种表现形式的数据被称作具有多视角的数据。面向多视角数据的非监督学习或者数据融合问题一直以来都受到人们的关注,然而,由于问题难度较大和相关的数学工具的缺少,该问题直到目前都没有取得太大进展,现有的融合方法都不是很成功。近年来由于半监督学习中的co-training算法和监督学习中的多核学习算法的成功,非监督的多视角学习再一次引起了人们的重视。数学和计算机等学科中新的方法的引入也为多视角学习提供了有用工具,有效的解决了融合中出现的多种问题。 本文系统的总结了多视角数据的特点及无监督多视角学习的研究进展。对于多视角数据中单个视角的信息缺失问题,我们提出一种使用SNE(StochasticNeighbour Embedding,随机邻域嵌入)进行数据融合的方法。在该方法中,我们给出了信息缺失原因的一种假设,从而使算法达到补全信息的目的。通过交替迭代方法我们在一定程度上避免了原SNE算法不收敛的问题,最终得到一个稳定点。实验证明,我们的方法可以在现实数据的数据可视化和降维中取得很好的效果。