论文部分内容阅读
神经信息学是集神经学、信息学以及计算机科学于一体的跨学科研究领域。随着科学的进步和新技术的应用,产生了海量的脑图像数据。近年来,应用高效的数据挖掘算法对这些数据进行分析处理,揭示数据背后隐藏的信息和规律,研究脑认知的工作机理,成为新的科研热点。本文着重讨论在没有医学先验知识情况下,对功能磁共振成像(functional Magnetic Resonance Imaging, fMRI)数据进行预处理、特征降维、特征提取,并在此基础上对隐含脑认知状态进行分类识别的模型。首先介绍了基于统计参数图软件包(Statistical Parametric Mapping, SPM)对fMRI图像进行预处理的详细步骤,并对预处理后的数据进行了初步降维。给出了两种数据驱动的特征抽取方法:潜在语义分析基于奇异值分解,将高维向量投影到低维潜在语义空间中,不仅可以实现有效降维,还能捕获数据的潜在信息;主成分分析以特征值分解为基础,消除多元变量间的相关性,用尽可能少的主成分,甚至仅用第一主成分,就能有效表示原始数据。实验证明,这两种方法可以将fMRI数据降至一维向量,分别用12个元素和8个元素表示。在上述工作的基础上,讨论了两种不同的脑认知状态分类识别模型。在应用潜在语义分析和主成分分析获得特征向量之后,使用改进的K最近邻算法,基于相似度,对待分类样本进行识别分类,取得了84.7%的分类准确率。考虑到fMRI数据的时间序列特性,使用粒子群算法改进了隐马尔科夫模型的训练过程,在应用主成分分析抽取各图像第一主成分之后,基于改进的模型对fMRI图像时间序列进行分类,取得了77.6%的分类准确率。实验证明,这两种机器学习方法,在基于fMRI的脑认知状态分类应用中的取得了很好的效果。