论文部分内容阅读
根据获取方式或来源的不同,模式可由多组不同类别的信息集组成,即由多组彼此不同的属性集构成。在特定的应用领域中,立足于不同的视觉角度往往可得到不同的视觉效果,即对同一模式可形成多组不同方位或多层次的信息。在不同视角下的数据可能存在着较强的信息互补性,充分利用它们,能够达到从不同的角度来刻画待解决问题的目的。这种思想在半监督学习中得到充分的体现。在半监督学习中,存在大量未标记样本和少量的已标记样本,需要利用未标记数据辅助已标记数据来获得较好性能的学习器。协同训练是一种简单有效的半监督学习方法,且是基于多视角的,通过不同的视角可以得到多个学习器。在学习过程中,学习器选出置信度较高的未标记样本进行相互标记,从而用于更新模型。目前,这个算法在广度及深度上都得到了扩展,基于协同训练设定下,也提出了很多新的多视角半监督学习算法。它们的成功应用展现了多视角学习方法的可行性。但在现实应用中,很多数据集仅仅只包含一个视角的描述,这在很大程度上限制了多视角学习方法的应用。因此,研究从原始数据中生成多个视角描述的方法是十分有意义的。首先,本文采用遗传算法进行特征选择,根据最终模型目标,从已知的一组特征集中选择出有明显区分特性的特征子集,用其形成多个视角。这些由从原始数据集中选择出的与输出结果有关或重要的特征构成的视角,对于构造具有充分性的学习器是有保证的。实验结果以及与任意划分特征集形成多个视角的方法的比较表明,特征选择用于形成多个视角的方法是行之有效的,并且能够得到较充分的多个视角。其次,本文为了获得更好的泛化性能,尝试了用多任务学习代替传统的单任务学习。本文完成了多任务学习在交通流量和人脸识别方面的应用,实验结果证明了其提高学习器的泛化性能的特点。最后,将多任务学习应用于多视角半监督学习中,形成多视角多任务学习。希望多个任务平行进行学习的过程中,任务的训练信号中所包含的领域信息能够用于进行归纳偏置,从而改进泛化性能。实验表明多任务学习的引入,起到了改进学习器的泛化性的作用。