论文部分内容阅读
在人工智能领域,模式识别是一个非常重要的方面。模式识别系统主要分为两部分:第一部分从输入模式中提取用户需要的特征,实现模式到特征的转换;第二部分是根据所选取的特征度量进行分类的问题,即决策问题,实现把输入模式指定到某一类中。本文就如何提高识别性能对模式识别系统的第二部分进行了研究。本文首先对最小距离分类器模式识别方法进行分析和研究,提出其存在的缺点。在最小距离分类器中,通过对欧氏距离度量的分析,引入自适应距离度量,提出了基于自适应距离度量的分类器设计方法。首先利用训练样本建立自适应距离度量模型,该模型保证了训练样本到相同模式类的距离最近,到不同模式类的距离最远,根据该模型建立目标函数,求解目标函数,得到一组最优权重。在分类时,应用最优权重进行加权定义,从而获得更好的识别效果。但是单一分类器由于其采用的特征类型单一性以及自身的局限性,改进的距离度量尽管在一定程度上提高了识别性能,但是这种提高有限。研究表明,不同分类器在识别性能上有互补作用,因此如何把各种分类器结合在一起,从而能够集成各个分类器的优点,而抑制它们的缺点,是提高识别性能的关键,本文对多分类器组合进行了研究。多分类器组合主要分为并联与级联两种方法,本文对多分类器组合的这两种方法进行研究,首先应用Bagging技术,将本文设计的基于自适应距离度量的分类器进行集成(并联组合),提出了一种基于自适应距离度量的最小距离分类器集成方法。另外,本文通过对最小距离分类器和支持向量机进行研究,充分利用MDC和SVM的优点,提出了一种将最小距离分类器和支持向量机分类相结合的方法,形成了一种新的分类器。首先用最小距离分类器进行分类,找到待识别样本到样本均值的最近邻和次近邻,根据最近邻和次近邻定义可信度,如果可信度大于预先设定的分类阈值,则待分类模式直接用MDC进行分类;否则,用最近邻和次近邻所对应的训练样本训练SVM,用SVM对它进行分类。本文在实验中,采用UCI标准数据集进行实验,结果表明本文提到的方法都是有效的。