论文部分内容阅读
脑胶质瘤是颅内最常见的恶性肿瘤,也是颅内肿瘤中最难治愈的肿瘤。世界卫生组织将脑胶质瘤分成Ⅰ-Ⅳ四个级别,Ⅰ级、Ⅱ级为低级别胶质瘤,Ⅲ级、Ⅳ级为高级别胶质瘤。相对于低级别胶质瘤,高级别胶质瘤侵袭性更强、预后更差。脑胶质瘤术前的准确分级对于患者治疗方案的选择和预后评估至关重要。磁共振成像(Magnetic resonance imaging,MRI)是脑胶质瘤患者首选的成像检查方式。临床上,依靠影像科医生的人工阅片给出定性评估。近年来,随着人工智能的发展和影像组学的提出,通过影像组学对影像的定量分析来预测脑胶质瘤的分级为脑胶质瘤临床研究提供新的思路。尽管影像组学方法在脑胶质瘤分级及其相关研究中获得了阶段性成果,但仍存在以下几个问题:(1)高质量的多中心脑胶质瘤数据集稀缺。当前大多数研究仍基于公开数据集或单一来源的小规模数据集,缺乏必要的外部验证且难以发现更一般性的规律。(2)现有的多中心影像数据集普遍存在差异性,没有实现标准化。由于数据通常来自多家医疗机构的不同设备成像模型,设置不同扫描参数和不同成像协议,在影像上表现为不同分辨率、不同的对比以及亮度。势必对影像组学的模型准确性产生影响。(3)影像科医生手工分割感兴趣区(Regionof Interest,ROI)工作量较大,效率低下。目前,手工分割ROI仍被视为影像分割“金标准”,但手工分割重复性强,分割任务繁重,容易使影像科医生在分割时出现主观性偏差。针对以上影像组学的脑胶质瘤分级中存在的若干关键问题,本文主要的基础性和创新性工作如下:1)为了深入研究多中心影像数据特点,并检验算法的效能,构建了本文研究所用的多中心脑胶质瘤数据库。整合脑胶质瘤公开数据集BraTS2017,收集并整理了郑州大学第一附属医院脑胶质瘤回顾性病例,构建内部数据集GI2019,联合公开数据集和内部数据集构建更大的多中心数据集。按照公开数据集标准,对内部数据集进行数据类型标准化和数据脱敏。另外,针对所有数据中影像对比度和亮度差异性的问题,提出了使用直方图规定化方法,缓解影像对比度和亮度差异性对影像组学脑胶质瘤分级的影响。直方图规定化能将影像的灰度分布按照基线图像的灰度分布进行调整,使批量影像具有相似的灰度分布,进而实现影像标准化。实验表明,经过直方图规定化算法处理过的影像用于影像组学脑胶质瘤分级时,分级准确度有显著提升,为影像标准化的研究提供新的思路。2)针对直方图规定化方法中,影像科医生手工挑选映射基线图像带来的主观偏差以及产生额外交互的问题,提出一种参数可控的直方图规定化算法(Histogram Specification of Parameters Controllable-Grid Search,HSPC-GS)。HSPC-GS使用可调控对比度和亮度两个参数的高斯概率密度函数构造基线图像直方图,再通过直方图规定化生成标准化图像,这种构造直方图的方式克服医生挑选基线图像产生的主观偏差。为了求解最优的标准化图像,指定影像组学脑胶质瘤分级作为网格搜索任务,将AUC定义为评价指标,网格搜索根据AUC水平进行调参,实现最优标准化图像的自动求解。实验表明,经过HSPC-GS算法处理的数据集具有出色的稳定性,相对于直方图规定化方法,分级准确度有进一步的提升。3)针对HSPC-GS算法提取原始图像信息不够充分的问题,提出一种基于像素关联度及参数可控的直方图规定化算法(Pixel Correlation-based Histogram Specification of Parameters Controllable and-Grid Search,PCHSPC-GS)。HSPC-GS算法中只描述了图像灰度的分布,没有考虑像素与相邻像素的关联度。实际上,肿瘤的形态和性质主要通过影像中像素灰度值的改变来描述的,提取像素与相邻像素的灰度值关联度特征能更具体地描述影像信息。因此,PCHSPC-GS利用二维直方图对多中心原始影像进行建模,该模型能够提取像素关联度特征。其次,对应地构造二维高斯函数,并保留了参数可控的特性。PCHSPC-GS同样采用了网格搜索策略,将影像组学的脑胶质瘤分级和IDH基因型预测定义为网格搜索任务,通过网格搜索寻找最优的参数组合,同时获得最优的标准化图像集。实验表明,经过PCHSPC-GS算法处理的标准化数据集同样保持出色的稳定性,所构建的分级模型和基因型预测模型准确率也有一定提升。4)针对当前影像科医生手工分割ROI工作量巨大、效率低下的问题。提出一种用于脑胶质瘤MR图像池化融合算法(Slices Pooling,SP)。SP算法通过融合不同MR切片上相同位置的灰度值来生成融合图像,影像科医生由传统的逐层标注转变为仅需对单层的融合图像进行标注。另外开发了用于脑胶质瘤分级和IDH状态预测的影像组学模型,通过模型验证融合图像在临床任务上的有效性。实验表明,SP算法能显著缩减影像科医生在分割ROI上的时间消耗,融合图像在图像质量上仍能保持出色的表现。基于融合图像构建的脑胶质瘤分级模型能保持良好的诊断准确度,IDH状态预测的模型准确度略有下降。