论文部分内容阅读
经典分类模型总是假定测试样本属于训练类之一,然而在实际应用中往往存在非训练类例外模式作为输入的情况,这时由于分类器缺乏拒识能力,只能给出错误识别结果。可见,设计可拒绝分类模型有着重要的意义。在可拒绝分类问题中,由于搜集非训练类样本较为困难,所以通常假设训练阶段没有非训练类样本参与。这时,构建高维空间同类事物分布的合理覆盖模型,再判断测试样本是否在覆盖体内成为解决可拒绝分类问题的关键。本文以此为出发点,针对一些新的可拒绝分类模型展开研究。依据区分和认识相结合的设计思路,提出基于SRM(Structural Risk Minimization)自组织多区域覆盖的可拒绝近邻分类算法。该算法根据结构风险最小化原则对训练类构造自组织多区域多球覆盖认识模型,并利用k近邻综合策略构造区分模型。实验结果验证了该算法的有效性。根据同类样本分布在同一个非线性流形上的假设,研究基于稀疏表示结合流形子空间覆盖的可拒绝分类算法。通过在非线性流形上寻找局部线性模块,构建训练类的紧致覆盖模型,再利用稀疏表示策略构建不同类别的区分性描述。该方法取得良好的识别效果。为了在加强训练样本区分性描述的基础上构建样本分布的合理覆盖,提出基于区分性投影结合最小L1球覆盖的可拒绝分类算法。该算法通过L1范数最大化主成分分析提取样本的区分性投影特征,并在特征空间建立对离群点具有良好鲁棒性的最小L1球覆盖模型,提高了分类器的性能。在样本较少的情况下,统计可拒绝分类方法难以对样本分布建立紧致覆盖。为此,研究基于高维空间最小生成树覆盖模型的可拒绝分类算法,该算法将最小生成树的边作为虚拟样本以提供更好的类别分布信息,并通过引入覆盖半径调整策略解决因不合理虚拟样本造成覆盖冗余的问题。