论文部分内容阅读
脑疾病的早期诊断和干预,对于其治疗和相关药物的研究,都具有十分重要的意义。采用脑图像检测是目前使用较广泛的脑疾病早期诊断方法。近年来,机器学习被广泛地应用于脑图像分析中。然而,当前大多数基于机器学习的脑图像分析研究主要集中于在多模态图像上设计监督学习算法与模型,且训练集样本大多来自同一学习领域。为了充分利用相关学习领域的先验知识,迁移学习被提出并能较好地解决此类学习问题。本文基于多模态脑图像与生物标志,同时结合相关领域的先验信息,提出了基于迁移学习的多模态分类、回归方法。本文的创新性研究工作主要有:(1)为充分利用相关学习领域的先验知识,提出了多模态领域迁移学习分类模型。首先,为了找出多领域共同有效的特征子集,根据组稀疏化正则化方法,设计了领域迁移学习特征选择方法DTFS。然后,为了同时移除多模态多领域训练集中所包含的带噪声的或不相干的样本,结合交叉领域核与组稀疏正则化方法,提出了多模态领域迁移学习样本选择方法DTSS。最后,为了利用多模态之间互补信息以及多领域之间的相关信息,根据自适应支持向量机和多核学习,提出了多模态领域迁移学习支持向量机DTSVM。在标准数据集ADNI上实验验证了该分类模型的性能。(2)为充分利用多模态相关学习领域结合未标记数据的先验知识,提出了流形正则化的多模态迁移学习分类模型M2TL。首先,为了利用多领域的相关性知识并且降低领域之间数据分布的差异性,构建基于交叉领域核的均值差异最大化准则(KMMD)。然后,为了有效利用标记样本与未标记样本之间数据分布的结构信息,构建基于交叉领域核的流形正则化项。接着,为了同时移除多模态多领域训练集中含噪声的、不相关的样本,引入组稀疏正则化项,再结合KMMD准则与流形正则化项,将传统的半监督流形正则化最小二乘法分类模型,扩展为M2TL分类模型。在标准数据集ADNI上实验验证了M2TL分类模型的性能。(3)为了精确诊断脑疾病患者临床疾病阶段,提出了半监督多模态迁移学习相关向量机回归算法SM-RVR。首先,为了获取多模态之间互补性判别信息,根据多核学习技术,提出了多模态相关向量机回归方法M-RVR。由于获取标记样本通常是昂贵且费时,我们将M-RVR扩展为SM-RVR。然后,设计了多模态k-近邻法,用于估计未标记样本的目标变量值。接着,为了找出最有效的未标记样本,设计了基于M-RVR的样本选择算法。最后,结合选择出的未标记样本,采用M-RVR估计测试样本的目标变量值,以此来诊断患者临床疾病阶段。在标准数据集ADNI上实验验证了SM-RVR回归模型的性能,并表明SM-RVR对精确诊断脑疾病患者临床疾病阶段具有较大的潜力。(4)为充分利用多标记多相关学习领域的先验知识,提出了基于多模态的多领域多标记迁移学习模型MDML。首先,为了利用不同标记组之间的相关性信息,同时又保留各标记组自身判别信息,根据稀疏Lasso特征学习和多标记学习框架,构建多标记稀疏group-Lasso特征选择模型。然后,为利用多领域的相关性知识,引入迁移学习思想,构建多领域多标记迁移特征学习模型。最后,为了利用多模态之间的互补信息,将MDML方法寻找出在多模态脑图像上最具判别性的特征子集,输入到多模态支持向量机、M-RVR,用于分类或回归。在标准数据集ADNI上实验验证了MDML的性能。实验结果表明,提出的MDML能同时找到用以分类与回归有效特征子集。