论文部分内容阅读
随着空气污染的加深,人们对呼吸系统健康的关注也越来越高。肺腺癌作为一种较多发于女性或非吸烟人群的肺癌,其早期切除手术后5年生存率较高,因而早期诊断十分关键。肺腺癌诊断依赖胸腔CT成像技术,影像科医生需要耗费十数分钟的时间从CT影像中筛查出肺腺癌。面对越来越高的胸腔CT诊断需求,提高影像筛查速度十分关键,利用快速精准的计算机辅助诊断算法从CT扫描检测出肺腺癌是一种有效的解决方案。目前,针对肺腺癌的检测算法研究较少,但该问题与肺结节检测较为相似。肺结节检测算法通常分为两个阶段,包括定位候选肺结节和良恶性分类。本研究中,第一阶段从CT影像中定位候选肺腺癌病灶,降低假阴率;第二阶段筛查出候选病灶中的假阳样本,并将真阳样本分类为原位腺癌和微浸润腺癌。在肺结节检测算法中,基于卷积神经网络(convolutional neural network,CNN)的检测算法较传统手工设计特征算子的方法效果更优,准确率更高。但CNN参数量较大,训练成本高,在两个阶段中各使用一个CNN模型进一步增加了算法整体的训练难度,且内存占用更高,提高了算法应用的硬件标准。然而,由于肺腺癌体积较小,且尺度不一,若使用单个CNN进行多任务的一阶段肺腺癌检测,影像经过CNN多次下采样后仅可得到单一尺度的候选病灶边界框定位。对于小尺寸肺腺癌而言,该边界框中的特征包含了较多的负样本(背景)信息,进而降低了检测的准确率。此外,本研究使用的肺腺癌数据集缺少所需的病灶尺寸信息,无法得到定位阶段所需的边界框标注。针对上述问题,本研究针对性地提出改进方案,主要包含以下内容:1.针对二阶段肺腺癌检测算法中两个CNN级联的参数量较高、内存占用大的问题,本研究设计并实现了一种单连接路径。单连接路径可以利用CNN浅层卷积核相位成对现象,通过特征图取反并拼接的方式取代参数化训练。在不降低模型检测效果的前提下减少了CNN的参数量。该模型在肺结节假阳性筛查中效果优于参数量较高的三维残差卷积神经网络。2.针对单一尺度边界框定位导致小尺寸肺腺癌特征中包含较多背景信息的问题,本研究通过特征金字塔结构,生成多尺度特征图。对于尺寸较小的肺腺癌,可以提取更加紧密的边界框定位,减少冗余特征,提高进一步分类的准确率,实现一阶段肺腺癌检测。该算法在肺腺癌检测中的敏感度高于二阶段检测算法。3.针对肺腺癌数据集缺乏定位所需的边界框标注,本研究利用迁移学习弥补所需的病灶尺寸信息,基于肺结节与肺腺癌之间具有相似的纹理特征,采用具有轮廓标注的肺结节数据集训练肺腺癌语义分割模型,得到肺腺癌的语义分割结果,获取边界框信息。最后,本研究针对实验结果,从假阳样本分布特点、边界框回归在小尺寸目标检测中的不足以及数据类别失衡三个方面进行分析和讨论,为后续研究提供思路。