论文部分内容阅读
我国大脑疾病与功能障碍人群的规模世界第一并持续增长,以抑郁症、帕金森症乃至老年痴呆最为典型,已发展成迫切需要解决的社会问题。典型脑疾病及时有效的诊治取决于大脑电生理活动状态的准确判别。当前脑科学与临床医学极大地依赖于非侵入式脑成像技术,比如脑电图以及(功能性)磁共振成像等,实现多个脑区乃至全脑活动过程的观测。病理性脑成像数据分析是脑疾病辅助诊断与机理研究的必要手段,然而现有分析技术的性能与脑疾病精准评估的需求之间仍存在显著差距,在特征构建、同步度量、异常判别三个层面的基础理论方法有待突破,这突出表现在以下三大技术瓶颈:第一,特征构建脑成像数据反映与表征着复杂的大脑神经活动状态,其外部表征为多重数据属性与强数据相关性,多维数据(张量)相比早期单纯的时间序列等低维记录病理信息更丰富;同时大脑神经元活动的动力学特性决定了脑成像数据强烈的非线性与非平稳特性。当前信号处理领域的小波变换等传统方法适用于二维数据,难以准确表达多重数据间的关联关系;传统平行因子分析与Tucker分解模型理论上适用于脑成像张量数据,然而模型求解通常依赖迭代线性求导与矩阵间的线性数值运算等线性方法,高非线性的脑成像数据分解误差过大;近期出现的贝叶斯张量分解方法,依赖于先验选择与人工超参数设定单一的非线性核函数,问题场景的适用性与结构化特征的质量均难以保证。第二,同步度量不同脑区间存在同步现象,通过多通道脑电等度量脑区间的同步特性对检测与理解大脑活动紊乱意义重大。传统基于线性的同步度量方法(如互相关分析等)难以准确表达非线性脑电数据的同步关联关系;而当前基于非线性的同步度量方法(如希尔伯特变换等)主要适用于低噪声、低干扰宽带信号的相位信息提取,难以准确描述包含强噪声与强干扰成分脑电信号的相位同步模式;最近出现的互信息和图论等方法理论上适用于度量异构数据(数据块包含的元素个数不同)间的同步关系,但实际上其方法求解通常依赖于计数、求和与加权等数值的策略,而忽略了异构数据间固有的空间分布特征,导致脑区间的同步度量误差过大,尺度与空间分布均存在差异的脑区同步度量的准确性均难以保证。第三,异常判别脑功能障碍由于存在个体差异性大、发展阶段非平稳的特点,使得当前定制、静态判别模型的性能难以保证。而传统基于神经网络模型的判别模型由于其超参数的调整主要依赖于手工和经验,导致模型适用的范围与周期均受到限制。另外,由于随机优化等传统方法的寻优过程也存在不可控的特点,使得其结果的稳定性难以保证;而近期涌现的贝叶斯优化方法也面临着超参数空间大、优化模型不可分等问题,并且由于时间复杂度过大使得其往往只停留在理论可行的阶段,难以大规模地投入实际使用。针对以上三个技术挑战,本文基于高阶张量因子化、梯度下降以及贝叶斯优化等理论,在脑成像数据非线性分解、异构脑区同步度量以及神经网络超参数优化方面取得了以下创新性成果:(1)多维脑成像数据深度非线性因子化分析方法。针对非线性脑成像数据的线性分解误差大这一问题,拟研究多维脑成像数据深度非线性因子化分析方法,该方法采用基于端到端的无监督学习模式以提取脑成像数据的结构化特征,其主要包括(1)基于无监督学习脑成像数据的非线性映射模式;(2)脑成像数据结构化特征因子构建与求精。首先,将多维脑成像数据(初始张量)沿各维度进行矩阵化,以作为无监督学习模型的输入;其次,采用基于卷积神经网络模型对不同维度的数据进行非线性拟合,以获取各维度的特征因子;再次,利用希尔伯特基张量与各维度特征因子的张量乘积构造复原张量;最后,设计初始张量与复原张量间的均方误差损失函数,反向求取结构化特征因子。实现多维病理性脑成像数据本质特征的低维、精确表达,提升多维数据的非线性分解精度。(2)基于异构矩阵相似性度量的脑区间同步分析方法。针对脑区同步的结构信息度量不准的问题,研究基于异构矩阵相似性度量的脑区间同步分析方法,其采用基于矩阵相似性度量的方法来刻画脑区间的同步相关关系,首先,借助最大信息系数在度量双变量同步关系的非线性和噪声鲁棒性等优势,研究无先验信息条件下脑区内所有通道的全局同步模式(相关矩阵);其次,建立从源矩阵“可达”目标矩阵的桥接矩阵,基于梯度下降理论优化欧式距离目标函数并求解桥接矩阵;最后,运用桥接矩阵计算结构信息丰富的脑区间同步。该方法作为生物标志物,提升对脑区的结构信息度量能力。(3)基于贝叶斯优化的脑障碍状态持续稳定判别方法。针对静态模型难以适应大脑病理状态的非平稳演化问题,研究基于贝叶斯优化的脑障碍状态持续稳定判别方法,该方法采用“分而治之”的策略,将大尺度超参数空间划分为多个相对小尺度的超参数子空间,通过优化多个子空间的最优化配置逐步实现神经网路的超参数优化。首先,根据超参数的类型将神经网络的整个超参数空间划分成多个子空间;其次,利用马尔科夫链选出一个对分类性能贡献最大的子空间;最后,对于待优化的子空间,利用贝叶斯优化方法求解子空间内所有超参数的最优配置,直至所有子空间的超参数都被优化。支持典型脑功能障碍的快速稳定分类,提升对脑障碍状态判别的稳定性。在典型脑疾病(抑郁症和帕金森)脑成像数据上进行相关疾病评估与判别实验,结果表明,在帕金森评估上,该方法所获取低维特征因子包含的信息量较平行因子分解、Tucker分解以及贝叶斯张量分解等方法均提高8%以上;该方法实现了脑成像数据的结构化特征因子对帕金森病病理的可解释性,并印证了德国法兰克福大学Heiko教授团队的观点:帕金森病的发生与深脑区域的病变强相关;在抑郁症评估上,该方法能准确度量脑电通道分布与数量相异的脑区间同步关系,所推断的同步关联模式可以作为抗抑郁药疗效评估的高置信度生物标志物,为准确理解抗抑郁药在治疗抑郁症时脑区间的相互作用奠定基础;此外,该方法能有效提升脑电数据自主更新模型的稳定性,经过超参数优化后的模型比进行再训练微调的模型性能提升4%以上,与传统贝叶斯优化相比本文提出的模型构建效率提升3.5倍以上。支持端到端的模型超参数自动优化,为快速、稳定监控大脑认知状态奠定基础。综上所述,本文针对多维病理性脑成像数据在脑疾病辅助诊断与机理研究中所遇到的技术瓶颈,拟在特征构建、同步度量、异常判别三个层面开展研究。所提出的多维脑成像数据深度非线性因子化分析方法,实现了对脑成像数据的结构化特征因子构建;提出的基于异构矩阵相似性度量的脑区间同步分析方法,实现了对脑区异构矩阵同步信息的精准度量;提出的基于贝叶斯优化的脑障碍状态持续稳定判别方法,实现了对大脑病理状态的非平稳演化的异常判别。总体显著提升了脑障碍状态识别的稳定性,初步奠定了脑成像数据的深度应用的基础。