论文部分内容阅读
肺癌是对人类健康威胁最大的恶性肿瘤之一,其早期表现形式是孤立性肺结节。计算机断层扫描(computed tomography,CT)是目前肺结节检测常用的影像学方法。随着计算机技术的快速发展和医学影像数据的剧增,计算机辅助诊断(computer aided diagnosis,CAD)系统得到广泛应用。CAD系统的临床应用减轻了医生工作量,提高了工作效率。因此,研究用于肺结节良恶性诊断的高效算法具有一定的现实意义。基于肺部CT影像的传统CAD系统包括肺实质分割、特征提取、分类器设计等阶段,其存在的问题是:过程复杂,人工干预多等。为了解决这些问题,端到端的机器学习模型得以应用。目前常用的端到端机器学习模型包括大规模训练人工神经网络(massive training artificial neural network,MTANN)和卷积神经网络(convolutional neural network,CNN)。大规模训练人工神经网络的核心处理单元是全连接网络,该网络结构复杂,参数过多,训练耗时。因此,本文研究卷积神经网络在肺结节良恶性分类上的应用。首先,自定义设计卷积神经网络模型。从网络模型深度、卷积核数目和卷积核大小等结构参数的选择,到激活函数类型、基础学习率和学习率衰减策略等训练参数的确定,通过大量对比实验,不断优化网络模型,确定最终模型结构,将该模型用于肺结节良恶性分类。其次,鉴于本文数据集较小,卷积神经网络模型容易出现过拟合问题,提出一种数据增强的方法,用于扩充训练样本,防止过拟合。具体操作为:对感兴趣区域划分局部子区域,选择包含结节相关特征的子区域,将其添加到训练样本中,从而以较大样本集对卷积神经网络模型进行训练。实验结果表明,本文自定义设计的卷积神经网络模型在肺结节良恶性分类中有较好的表现,各项评价指标中,准确率和AUC值分别达到89.5%和0.896。其次,为了验证本文提出的数据增强方法的有效性,使用扩充后的样本分别对微调的AlexNet模型、rd-CNN以及本文自定义设计的卷积神经网络模型进行训练。测试结果表明,三种网络模型的性能均有提升。与未扩充样本集相比,自定义设计的卷积神经网络模型的准确率和AUC值分别提高至92.5%和0.933。因此,本文研究工作对计算机辅助诊断系统性能的提升有一定参考价值。