论文部分内容阅读
摘要:模式识别(Pattern recognition)是上世纪七八十年代的流行术语。它是对原始数据信号(图像、语音、文字、视频等)进行分析、解释,从而得到其类别属性,继而进行判断的过程。模式识别技术是人工智能的基础技术,是机器学习(machine learning)的一个分支。
关键词:模式识别;类别属性;机器学习
一、模式识别的定义
模式识别(Pattern recognition)是上世纪七八十年代的流行术语。它是对原始数据信号(图像、语音、文字、视频等)进行分析、解释,从而得到它的类别属性,继而进行判断的过程[1-3]。模式识别技术是人工智能的基础技术,是机器学习(machine learning)的一个分支,从某种意义来说,模式识别几乎等同于机器学习。机器学习是一门多领域的交叉学科,涉及概率论、统计学等多门学科,它是一类从给定的数据中自動分析其规律,并且利用所获得的规律对未知的样本数据进行预测的算法。一个典型的机器学习流程如图1所示:
二、模式识别的基本流程
模式识别的基本流程一般包括数据采集,数据预处理,特征提取,特征选择以及模型的架构这几个模块,如图2所示:
(1)数据采集
很显然,数据采集过程是整个模式识别系统最基本的前提条件,一个具有良好性能的模式识别系统必定会首先获得较好的数据集。通过采集到的数据,就可以进行后续的预处理、特征提取、特征选择、以及分类模型架构等一系列的工作。一般而言,数据采集过程是需要借助相应的硬件设备,比如说声音传感器、图像传感器等设备来采集相应的数据。倘若所使用的传感器灵敏度不高,或者说传感器的精度不高,那么一定会对所采集到的数据产生噪声污染。尽管后续过程中一般会通过预处理操作来处理相应的数据,可以减少部分的噪声污染,但是却不能完全消除噪声的干扰。因此,数据采集部分应该尽量保证所得到的数据纯正、干净。而随着模式识别技术的快速发展,很多无私的学者将自己所获得的公认的数据集公开分享在各数据库中,从而方便广大的学术研究者方便使用。
(2)预处理
在模式识别技术领域内,预处理的过程一般是指去除噪声干扰,增强有效信息的过程。过程1)中也提到,在数据的采集过程中,不可避免地会引入一些干扰的因素。比如说,噪声污染以及无效信息的引入等因素,这不仅会增加后续处理过程的复杂性,而且也会影响整个分类模型的性能。因此,预处理过程是模式识别系统中的一个必要的过程。但是需要注意的是,尽管预处理的功能基本上都是减弱甚至消除噪声的干扰,同时也会加强有效信息的信息度,然而,对于不同的领域对象,不同的特征,其预处理的方法也是千姿百态的。
(3)特征提取
一般来说,从传感器中直接获得的数据属于原始测量空间的数据,然而原始测量空间中的数据是无法直接用来进行判别分类的;或者说,直接利用原始测量空间中所得到的数据来进行判别分类,其效果往往不尽如意。一般来说,需要将数据从原始的测量空间中转换到二次空间中,也即特征空间。特征提取是计算机视觉和图像处理中的一个概念。其指的是利用计算机来提取图像信息,决定每个图像的点是否属于一个图像特征。不同的领域内,特征提取的方法也有所不同,有文本特征向量提取,视觉图像特征提取,局部LBP特征等等。
(4)特征选择
在经过数据采集,数据预处理,特征提取过程之后,数据就从原始的测量空间中转换到二次特征空间,而此时所提取的特征不一定是我们所最需要的特征,其中包含了大量的不相关以及冗余的特征,对最终的分类判别不一定有很好的效果。这些不相关或者冗余的特征不仅会极大地增加计算的复杂性,而且还会减弱分类器的分类性能。因此,模式识别过程中,需要进行特征选择,其作用就是从所提取的特征中去除那些不相关以及冗余的特征,从而挑选出对模式最终判别分类效果最好的特征,其实这也是一个寻优问题。
(5)分类判别模型架构
在经过特征选择技术后,就需要对所选择出的特征进行判别分类。一般来说,简单点的分类判别方法其实就是将特征表示为向量的形式。然后,利用像欧氏距离、马氏距离、卡方距离、范数等手段来计算任意两个向量之间的相似性,最后再根据计算所得到的向量之间的相似性来进行分类判别。复杂点的分类判别方法是利用SVM、ANN、贝叶斯判别等方法将特征进行某种线性或者非线性的变换,从而在变换后的空间进行二次分类。
三、完整的模式识别过程
一个完整的模式识别过程包括三个步骤:学习模块、训练模块以及验证模块,可以用如图3来进行表示
上述是对整个模式识别里面一些基本而又非常重要的概念、流程的简单介绍,也是学号模式识别与机器学习所要了解的基本知识,以可视化的图形更易于去理解。
参考文献
[1]杨淑莹,张桦.模式识别与智能计算:MATLAB技术实现[M].City:电子工业出版社,2015.
[2]Fred A,Marsico M D.Pattern Recognition Applications and Methods[J].Advances in Intelligent Systems & Computing,2015,318:1-2.
作者简介:李星星,1991.4,男,江西九江,广州工商学院,无 ,模式识别与图像处理。
关键词:模式识别;类别属性;机器学习
一、模式识别的定义
模式识别(Pattern recognition)是上世纪七八十年代的流行术语。它是对原始数据信号(图像、语音、文字、视频等)进行分析、解释,从而得到它的类别属性,继而进行判断的过程[1-3]。模式识别技术是人工智能的基础技术,是机器学习(machine learning)的一个分支,从某种意义来说,模式识别几乎等同于机器学习。机器学习是一门多领域的交叉学科,涉及概率论、统计学等多门学科,它是一类从给定的数据中自動分析其规律,并且利用所获得的规律对未知的样本数据进行预测的算法。一个典型的机器学习流程如图1所示:
二、模式识别的基本流程
模式识别的基本流程一般包括数据采集,数据预处理,特征提取,特征选择以及模型的架构这几个模块,如图2所示:
(1)数据采集
很显然,数据采集过程是整个模式识别系统最基本的前提条件,一个具有良好性能的模式识别系统必定会首先获得较好的数据集。通过采集到的数据,就可以进行后续的预处理、特征提取、特征选择、以及分类模型架构等一系列的工作。一般而言,数据采集过程是需要借助相应的硬件设备,比如说声音传感器、图像传感器等设备来采集相应的数据。倘若所使用的传感器灵敏度不高,或者说传感器的精度不高,那么一定会对所采集到的数据产生噪声污染。尽管后续过程中一般会通过预处理操作来处理相应的数据,可以减少部分的噪声污染,但是却不能完全消除噪声的干扰。因此,数据采集部分应该尽量保证所得到的数据纯正、干净。而随着模式识别技术的快速发展,很多无私的学者将自己所获得的公认的数据集公开分享在各数据库中,从而方便广大的学术研究者方便使用。
(2)预处理
在模式识别技术领域内,预处理的过程一般是指去除噪声干扰,增强有效信息的过程。过程1)中也提到,在数据的采集过程中,不可避免地会引入一些干扰的因素。比如说,噪声污染以及无效信息的引入等因素,这不仅会增加后续处理过程的复杂性,而且也会影响整个分类模型的性能。因此,预处理过程是模式识别系统中的一个必要的过程。但是需要注意的是,尽管预处理的功能基本上都是减弱甚至消除噪声的干扰,同时也会加强有效信息的信息度,然而,对于不同的领域对象,不同的特征,其预处理的方法也是千姿百态的。
(3)特征提取
一般来说,从传感器中直接获得的数据属于原始测量空间的数据,然而原始测量空间中的数据是无法直接用来进行判别分类的;或者说,直接利用原始测量空间中所得到的数据来进行判别分类,其效果往往不尽如意。一般来说,需要将数据从原始的测量空间中转换到二次空间中,也即特征空间。特征提取是计算机视觉和图像处理中的一个概念。其指的是利用计算机来提取图像信息,决定每个图像的点是否属于一个图像特征。不同的领域内,特征提取的方法也有所不同,有文本特征向量提取,视觉图像特征提取,局部LBP特征等等。
(4)特征选择
在经过数据采集,数据预处理,特征提取过程之后,数据就从原始的测量空间中转换到二次特征空间,而此时所提取的特征不一定是我们所最需要的特征,其中包含了大量的不相关以及冗余的特征,对最终的分类判别不一定有很好的效果。这些不相关或者冗余的特征不仅会极大地增加计算的复杂性,而且还会减弱分类器的分类性能。因此,模式识别过程中,需要进行特征选择,其作用就是从所提取的特征中去除那些不相关以及冗余的特征,从而挑选出对模式最终判别分类效果最好的特征,其实这也是一个寻优问题。
(5)分类判别模型架构
在经过特征选择技术后,就需要对所选择出的特征进行判别分类。一般来说,简单点的分类判别方法其实就是将特征表示为向量的形式。然后,利用像欧氏距离、马氏距离、卡方距离、范数等手段来计算任意两个向量之间的相似性,最后再根据计算所得到的向量之间的相似性来进行分类判别。复杂点的分类判别方法是利用SVM、ANN、贝叶斯判别等方法将特征进行某种线性或者非线性的变换,从而在变换后的空间进行二次分类。
三、完整的模式识别过程
一个完整的模式识别过程包括三个步骤:学习模块、训练模块以及验证模块,可以用如图3来进行表示
上述是对整个模式识别里面一些基本而又非常重要的概念、流程的简单介绍,也是学号模式识别与机器学习所要了解的基本知识,以可视化的图形更易于去理解。
参考文献
[1]杨淑莹,张桦.模式识别与智能计算:MATLAB技术实现[M].City:电子工业出版社,2015.
[2]Fred A,Marsico M D.Pattern Recognition Applications and Methods[J].Advances in Intelligent Systems & Computing,2015,318:1-2.
作者简介:李星星,1991.4,男,江西九江,广州工商学院,无 ,模式识别与图像处理。