论文部分内容阅读
血液制品的鉴别分析对于进出口检验检疫、刑事侦检及野生动物保护等领域都尤为重要。传统的血液鉴别方法,易对血液制品样本造成不可逆转的破坏,且其较长的分析周期,难以达到进出口检验检疫等领域中对血液制品快速、无损的检测要求。拉曼光谱作为一种振动光谱可分析得到物质分子振动、转动信息,从而分析物质的组成,其零污染、非接触、测试快速等诸多特点,无疑为血液制品的快速无损鉴别提供了可能。现有的基于拉曼光谱的血液制品鉴别方法有很多。然而,这些方法常伴随繁琐的数据预处理过程,易因预处理不当而导致模型预测能力的下降。同时,这些方法多为线性模型,忽略了光谱中非线性因素的影响,降低了模型的分类性能,而非线性鉴别模型,又存在可解释性差等缺点。因此,本文利用深度学习优异的特征学习能力,研究基于深度学习的血液制品拉曼光谱分析新方法,以克服现有分析方法的不足。主要研究内容包括:1)研究现有拉曼光谱分析方法基本理论,包括拉曼光谱分析基本原理、常见预处理方法和校正模型等,深入探讨其存在的不足,并以深度学习强大的特征学习能力为突破口,以克服现有方法存在的问题。2)针对现有去噪、基线校正方法的不足,通过对深度学习网络结构、目标函数等方面的优化,将拉曼光谱去噪、基线校正方法以卷积的方式融合到深度学习网络中,提出基于卷积神经网络的拉曼光谱分析新方法(Raman-CNN),实现了对拉曼光谱的自适应数据预处理过程。并利用神经网络模型强大的非线性映射能力,提升模型预测性能。实验结果表明,该方法不仅预测性能卓越,且其预处理能力也较传统方法更优。3)受深度学习网络Squeeze-and-Excitation Net(SENet)关键思想启发,通过对其SE模块网络结构的简化和稀疏约束的增加,提出了一种基于深度学习的拉曼光谱稀疏波长选择新方法(Raman-SENet)。该网络不仅能自学习出稀疏权重从而完成对拉曼光谱波长选择,其自身还可以作为一种可解释性较强的非线性校正模型。实验结果表明,作为波长选择方法,Raman-SENet能以更少的波长点建立较传统波长选择方法更优的模型;作为非线性校正模型,它有效的克服了传统非线性方法可解释性差这一缺点。而与Raman-CNN的结合,更是形成了一套强大而较为完备的深度学习拉曼光谱分析方法(Raman-DANet),该方法不仅拥有较强的预测性能,且其网络各层之间功能明确,可解释性强,实现了将去噪、基线校正以及波长选择三位一体的自适应预处理过程。4)针对进出口检验检疫对与血液种属鉴别的迫切需要,基于本文提出的方法Raman-DANet,为重庆大学微系统研究中心研制的微型拉曼血液专用分析仪设计并开发了一套血液拉曼光谱鉴别软件,并对中国检验检疫科学研究院的34例血液样本进行了在线测试。测试结果可靠,初步满足了进出口检验检疫对于血液种属鉴别的需要。