论文部分内容阅读
在图像的处理中,由于图像的种类数量繁多,且单幅图像传递的特征信息较为复杂,因此如何描述图像特征成为一个关键性难题。所提取的图像特征传递的信息质量将直接影响对图像处理的结果。传统的手工设计的图像特征过于繁琐和低效。近年来广泛使用的神经网络很好的解决了这一问题。神经网络应用基于学习的图像特征提取方式,这种方式将图像数据作为神经网络的输入,将其经过一系列堆叠的线性组合及非线性变换转化为更高层次的抽象表示,自动逐层的提取图像的特征信息。含有多隐含层的深度网络往往能够对原始输入数据做出更加深刻和本质的刻画,从而学习到更加高级的数据特征表示。本文主要研究了基于深度网络的图像特征提取及应用,主要内容有:深入研究了两种深度图像特征提取工具:栈式稀疏自编码和卷积神经网络,分析了其结构与训练过程。并将其应用于两种图像处理任务中的特征提取:图像融合、以及图像识别:肺结节的检测和去假阳。栈式稀疏自编码器(Stacked Sparse Autoencoder,SSAE)是一种高效的无监督特征提取方法,具有良好的复杂数据表示能力。不同于传统的深度学习方法需要大量的带标注数据,栈式稀疏自编码器是一种无监督深度学习方法,适用于图像融合任务。通过在SSAE的隐藏层中添加稀疏约束可以获得图像的稀疏特征作为源图像的精确表示,有效的表达了图像的内部结构特征。结合一种先进的多尺度分解工具,即平移不变剪切变换(SIST),提出了一种新的基于SSAE提取图像特征的图像融合方法。首先,源图像被SIST分解为低频子带和高频子带;其次,采用两层SSAE作为特征提取方法,以获得高频子带的深层稀疏表示,接着,提出了选择最大基于SSAE特征的融合规则来融合高频子带系数;然后采用加权平均融合规则来合并低频子带系数;最后,通过逆SIST变换获得融合图像。实验结果表明,该方法在主客观评价方面都优于传统方法。卷积神经网络(Convolutional Neural Network,CNN)使用局部连接高效的提取图像特征,使用三维的网络结构能够有效地表达序列图像中的三维空间特征信息。这一特性使其适用于医学图像处理中的特征提取。去假阳是计算机辅助肺结节检测的关键步骤。其目标是从肺结节检测的第一步中获得的大量候选结节中识别出真正的肺结节。去假阳的难度在于,如何从3维的肺部图像序列中提取出有效的特征表达,以区分真正的肺结节和一些具有高度迷惑性的其它肺部组织。最近,残差网络因其卓越的性能在世界范围内越来越受到关注。提出了一种多上下文的三维余项卷积神经网络(3D Res-CNN)来实现肺结节检测中的去假阳。提出的算法使用两种尺度的网络来适应肺结节大小的变化,并使用余项连接以减小网络误差,学习到更具有表征能力的图像特征。另外,为了缓解数据的不平衡,首先对较少数量类别的原始图像块进行旋转和重新采样;接着在计算代价函数时为不同类别的数据分配不同的权重。对于肺部计算机断层扫描(Computed Tomography,CT)数据的实验表明,本文的方法获得了最优的表现:在每个受试者CT图像中分别有0.125、0.25、0.5、1、2、4和8个假阳结节的情况下,平均敏感度为0.843。实验结果表明了余项卷积网络从众多候选结节中识别真实的肺结节的有效性。综上,本文将两种基于深度网络的图像特征提取方法分别运用于两种图像处理任务,有效地表达了图像的本质特征信息。实验结果表明了基于深度网络的特征提取方法具有更强大的图像信息表示能力。