论文部分内容阅读
本文是广西壮族自治区教育厅科研项目(桂科自0339037)“建立基于头发微量元素分析的可用于辅助诊断的模式分类器”项目的一部分。本项目旨在利用统计模式识别的方法来建立基于头发微量元素分析的可用于辅助诊断的模式分类器,以揭示头发中的多个微量元素含量水平与某种疾病的发生之间的定量关系。通常,样品中的不同特征间存在某种程度的相关性。因此需要采用适当的特征提取方法以获得最合适的特征。在建立一个模式识别系统的工作中,特征选择与特征提取牵涉到相关特征的分类效能评价问题,因而是和分类算法紧密关联的。传统的特征提取方法主要有:主分量分析、奇异值分解、投影追踪、自组织映射等。但其分析方法仅限于二阶统计特性。本论文的主要工作在于引入了一种新的特征提取方法----独立分量分析。独立分量分析的根本原理是通过分析多维观测数据间的高阶统计相关性,找出相互独立的隐含信息成分,完成分量间高阶冗余的去除及独立信源的提取。它在特征提取中的应用目前主要是对图像进行特征提取,在本文中我们尝试用独立分量分析方法对项目中的鼻咽癌病人的头发中微量元素含量水平数据进行了特征提取。具体工作如下: (1)对项目中的鼻咽癌病人头发微量元素含量水平数据进行了预处理及分析。(2)详细阐述和分析了独立分量分析的理论和算法。(3)用基于信息论的FastICA 算法和Infomax 算法对预处理后的数据进行了特征提取。(4)用线性分类器、二次贝叶斯正态分类器、优化帕赞分类器、最近邻分类器对特征提取后的数据进行了分类。(5)实验结果表明,独立分量分析可以有效地提取非线性可分的分类问题中的高维数据的最有效的特征。