论文部分内容阅读
自闭症谱系障碍(Autism spectrum disorder,ASD)是一种常见的脑部疾病,近年来,随着计算机技术和医学影像分析技术的发展,使用静息态脑功能核磁共振(Resting-state Functional Magnetic Resonance Imaging,rs-fMRI)诊断自闭症成为研究的热门。这是因为rs-fMRI可以在无创的情况下,通过血氧依赖水平(Blood Oxygenation Level Dependent Contrast,BOLD)有效地反应患者脑部的功能性变化,通过rs-fMRI的医学影像分析,我们可以通过一种非侵入式且主观性较小的方式来诊断自闭症。目前,自闭症辅助诊断存在三个问题:数据集存在标记噪声;数据高维度且类不平衡;现有的自闭症辅助诊断多是二分类方法,没有实现ASD及其若干子类的区分。为此,我们引入了标记分布学习(Label distribution learning,LDL),通过标记分布学习本身的分类器特性解决标记噪声问题并实现多分类任务,同时引入一些特有的机制来应该对数据的高维度以及类不平衡,最终实现自闭症的辅助诊断。但是使用LDL对ASD进行辅助诊断,仍然存在以下两个问题需要解决:一是标记分布学习只解决了标记噪声和多分类问题,需要引进别的方法解决类不平衡问题;二是需要在标记分布学习的基础上,针对数据集的特点做出一些创新,提高分类器的正确率和鲁棒性。本文针对自闭症的医学影像数据特点提出了两个基于标记分布学习的自闭症辅助诊断新方法,较之于已有的自闭症检测研究方法,所提出的算法在准确率和鲁棒性上都有所提高。本文提出的两个主要工作具体内容总结如下:1)第一个工作是提出了代价敏感的标记分布支持向量回归学习(Cost Sensitive Label Distribution Support Vector Regression,CSLDSVR),该算法首先使用DPARSFA(Data Processing Assistant for Resting-State Advanced edition)工具处理rs-fMRI图像,提取脑部的平均时间序列,在计算皮尔逊相关系数,得到脑功能连接;然后在构造标记分布支持向量回归的分类器,并在分类器中加入代价敏感机制。实验表明,新的方法提高了对自闭症的诊断正确率,并且与传统的标记分布学习方法相比,新的方法克服了多数类和少数类对结果的影响,可以有效的解决ASD诊断中的不平衡数据问题,提高了对少数类的诊断正确率。2)第二个工作是提出了融合类共享及类独有特征的标记分布学习(Label Distribution Learning with Class-Shared and Class-Specific Constraints,LDL-CSCS),算法首先使用DPARSFA工具处理rs-fMRI图像,提取脑部的平均时间序列,在计算皮尔逊相关系数,得到脑功能连接;然后引入了合成少数类过采样技术(Synthetic Minority Over-sampling Technique,SMOTE),生成辅助训练的少数类样本,克服类不平衡问题;最后构造了融合类共享及类独有特征的标记分布学习分类器,在标记分布学习的基础上,融合了类共享及类独有特征,通过不同类之间的共通特征和每个类别的独有特征来提高分类器的鉴别能力。实验表明,新的方法预测的标记分布和真实分布更为接近,且标准差也较为平缓,这说明模型比之传统的标记分布学习的鲁棒性更佳,同时,诊断正确率也得到了提升。