论文部分内容阅读
近年来,随着雾霾和空气污染的严重,肺癌已经成为我国发病率和死亡率第一的致死癌症。广泛和多样的诊断手段对于肺部癌症的诊断是重要、急迫的。对于肺癌的诊断,诊断出早期的癌症是至关重要的,肺癌的早期表现是肺结节组织的出现。然而,正确的诊断肺结节的存在,这需要有广博的肺部先验知识和多年的诊断经验。计算机辅助诊断能够加速诊断的过程,提供“二次诊断”。基于模式识别的辅助诊断系统中,对肺结节图片的特征提取和分类是很关键的一环,直接决定分类的效果和时间。然而传统的特征选择基于人工选择,具有偶然性和不确定性。 本文使用一种自动的特征提取方法,主成分分析网络,该方法是一种基于深度学习的自动特征提取方法。同时,结合在图片领域广泛应用的支持向量机作为分类器,对正常与病变的图像进行分类。首先分析了人脑的自动特征提取模式,简要介绍了人脑特征提取中的分层和非监督的思想。从而引申出了深度学习网络中特征提取的分层和非监督的特性。其后介绍了本文中用到的几种典型算法原理。由于有肺结节图片和无肺结节图片有明显的结节差异,完全可以使用深度学习进行自动的学习和提取特征。然后介绍了本文对三种不同算法的实现过程。针对在CAD领域广泛应用的JSTR图片库,对有结节和无结节两类图片,使用主成分分析网络进行特征提取,使用 SVM进行样本分类。重点介绍了在实现过程中,对主成分分析网络过滤层数,支持向量机的惩罚因子等参数的选择。提出了实现过程训练时间过长、图片过大等问题,以期对后面的研究给出必要的参考。同时对实验的结果进行了说明和分析。结果表明,使用了主成分分析网络算法进行特征的自动选择以后,相比单纯使用支持向量机算法,对图片的识别准确率提升了10个百分点。同时,对比MacMahon的CAD系统,使用本文的CAD系统以后,准确率提升了3个百分点,对比Hardie的CAD系统,提高了5个百分点。表明提出的主成分分析网络和支持向量机的结合辅助诊断系统对于肺癌的辅助诊断是有效的,为临床应用提供了参考。最后在Matlab的图形界面下开发了一套软件系统,该软件系统可以提供读取图片、选择特征提取算法、选择支持向量机的核参数、输入训练支持向量机模型的参数,以及读取新的图片进行预测。在该系统下,可以方便的添加新的特征提取算法,新的分类器算法,与已有的算法进行对比和分析。