论文部分内容阅读
脑疾病不仅危害患者的健康和生命,同时也给患者及其家庭、社会带来沉重的经济负担和巨大的精神压力。而早诊断早治疗是消除脑疾病危害的唯一途径,神经影像则是对脑疾病进行早期诊断和治疗的重要工具。基于计算机科学的医学图像分析与处理技术已经被广泛应用于脑图像分析中。其中,稀疏学习技术由于能够发现数据固有的内在本质,已经得到了广泛的关注。脑图像分析中的挑战与难点问题之一在于如何学习及利用有效的特征,尤其是能够全面反映大脑信息的结构化特征,如多模态结构和脑网络结构等。脑图像分析一般包括数据采集、脑区分割、特征抽取、特征学习以及分类预测等步骤。本文依托稀疏学习技术针对脑图像分析中的脑区分割和特征学习两个部分,对结构化特征表达开展研究工作。具体的研究工作和创新点如下:(1)为在脑区分割中充分利用图谱图像结构特征具有的表达能力,提出一种基于层次稀疏表示的多图谱分割方法(Hierarchical Sparse Representation,HSR)。该方法首先使用树形结构对不同图谱图像进行字典(主字典和残差字典)构造,利用图谱图像块结构特征所具有的判别性,使构造出来的字典具有紧凑高效的表达能力。进一步,为剔除噪声以及减少背景图像块对最终分割结果的影响,利用主字典联合残差字典对目标图像块进行共同稀疏重建,实现更细致地组织和刻画。最终,当得到最优的稀疏重建系数后,使用重建残差来确定目标图像块所属标签。在ADNI与PPMI数据集上分别对与阿尔茨海默症有关的海马体,与帕金森病有关的脑干和基底核等脑区进行了分割实验,验证了提出分割方法的有效性,同时也证明提升重构字典的表达能力对稀疏重建具有重要的作用。(2)为在特征选择中最大化地保持不同模态数据之间以及模态自身的类别结构信息,充分挖掘多模态数据特征的判别能力,提出一种基于标号对齐的多模态特征选择方法(Label-aligned Multi-modality Feature Selection,LMFS)。该方法使用组稀疏化项,确保具有判别能力的特征能被联合地从多模态数据中选择出来。其次,为了嵌入模态数据的类别结构信息,在传统的多模态特征选择目标函数中引入标号对齐正则化项。在提出的算法基础上使用加速近似梯度(Accelerated Proximal Gradient,APG)方法来优化求解该问题。最后,使用多核支持向量机来融合所选择的多模态数据特征以进行最终的疾病诊断。提出的方法不仅能够在ADNI数据集上找到对疾病敏感的生物标志,并且在多组疾病分类中取得了较好的分类性能。(3)为在特征选择中克服高维特征之间的相似性度量不准确问题,提出自适应近邻学习策略,并以此为基础提出一种基于自适应近邻学习的多模态特征选择方法(Adaptive Similarity based Multi-modality Feature Selection,ASMFS)。传统的引入数据结构先验的特征选择方法往往需要在学习特征之前已知或者给定样本的结构关系,如样本两两之间的相似度,若给定的相似性度量不准确则会影响后续任务的性能。针对这个问题,提出的方法在多模态特征选择中,将样本相似度与稀疏权重系数同时建模。进而确保嵌入准确的模态结构,并诱导出更具有判别能力的特征。此外为了更好的刻画模态之间固有的相关性,假设所有模态数据共享同一个样本相似度矩阵。最后,使用交替迭代优化算法对提出的目标问题进行求解,并使用多核支持向量机对选择后的特征进行融合分类。在ADNI多模态数据集上与state-of-the-art方法进行了对比实验,验证了提出方法的有效性。(4)为在脑网络特征学习中挖掘多个脑区之间高阶结构的关联特性,提出一种基于直推式超图学习的脑网络选择方法(Transductive Hypergraph Learning based Subnetwork Selection,THLSS)。当前,基于脑网络的工作大部分都集中在考察脑部感兴趣区两两之间的关联性方面,即二阶关系,而忽略了更多脑区(例如三个脑区)的关联特性。更多的脑区可以构成子网络,这种包含高阶关系的子网络也许能够对疾病的早期诊断提供指导。针对这个问题,通过引入超图拉普拉斯正则化项和组稀疏约束进行直推式学习,对具有判别性的子网络进行挖掘,从而帮助寻找和发现有价值的生物标志。使用支持向量机和支持张量机在ABIDE和ADHD200脑网络数据集上进行实验。实验结果表明使用提出的方法能够发现与疾病相关的潜在子网络连接,将其用于分类能够获得很好的诊断结果。