论文部分内容阅读
仿生嗅觉技术作为一种模拟人类嗅觉神经系统的检测技术,因具有响应速度快、检测范围广及智能化程度高等特点,被广泛应用于食药安全、环境监测及生物医药等快速检测领域。然而,随着仿生嗅觉技术应用领域的拓展,感知的信息也呈现出高维度、强噪声、非线性等特性,继而出现测量数据失真、特征难以提取及识别性能降低等问题,具体表现为:(1)非理想情况下气味信息的有效获取与处理,受限于感知材料、设计方法及制造工艺的影响,目前仿生嗅觉系统在测量气体信号时,存在响应信号交叉重叠(一种传感器对多类气体检测有响应)、受环境因素影响明显(温湿度等)及易漂移等问题。(2)复杂气味图谱信息特征难以提取及识别,由于仿生嗅觉系统感知的数据都呈现高维非线性的特点,且数据降维后的特征空间与原始数据高度关联,因此,需要发展高效的降维及识别方法,以解决复杂数据的数据处理及特征提取。本论文从仿生嗅觉系统的基本原理出发,分析了仿生嗅觉系统应用拓展过程中面临的技术挑战,尤其是测量复杂对象时数据呈现高维度、非线性等特点,针对非理想情况下气味图谱信息有效获取,提出基于统计特征的抗漂移算法,解决传感器易漂移失真问题;针对近似同源复杂气味图谱信息特征难以提取及识别等问题,提出了多种有效数据降维及特征算法,通过大量样本数据进行综合对比,并最终给出最佳的解决方案,本文主要完成的研究工作如下:(1)针对仿生嗅觉系统中因金属氧化物气敏传感器受敏感材料、制造工艺等因素影响(测量响应易发生数据漂移),导致连续测量数据易失真的问题。本文提出了一种基于统计得分归一化的信号预处理方法,改善测量数据样本的整体规整性,降低因传感器漂移产生的测量数据失真影响。测试数据结果显示,本文所提出的基于统计得分归一化处理方法,能够有效降低因传感器漂移失真产生的测量数据噪声,为后续数据的降维数据及特征提取提供有效的数据支撑。(2)有效的数据特征选取可以降低数据处理的复杂度,本文中针对PEN3电子鼻系统测量响应的数据图谱特点,选取了基于统计特性和测量曲线模拟两大类共5种数学统计特征,用于表征测量响应图谱的内在特征,从而降低原始数据的处理维度。实验结果表明,通过特征数据选取,可以有效提升降维处理的复杂度,同时也优化了降维后的特征空间分布。(3)为了提升仿生嗅觉系统测量气体的种类数量及测量数据的有效性,通常采用组建传感器阵列来测量气体,在采样的数据及特征信息量显著提升的同时,采样数据在空间上呈现高维度且交叉重叠分布,尤其在处理大样本数量时,容易引发数据维度灾难,导致无法进行特征提取或提取的特征无法有效表征数据,本文提出了一种基于PCA+FLDA线性级联处理算法,用于处理高维数据的降维及特征提取,通过对4种工业毒害气体数据样本的测试,实验结果表明,同等条件下,PCA+FLDA>FLDA>PCA,PCA+FLDA的平均识别准确最高为84.80%,最高识别准确率为86.41%。(4)针对仿生嗅觉系统测量的复杂数据难以降维及特征提取的问题,尤其是所提出的PCA+FLDA级联处理算法中线性判别分析过程中,因样本类内散布矩阵Sω为奇异矩阵,则矩阵没有实数解,从而导致无法进行最优映射(非实数空间)的问题。本文提出了一种基于嵌入核函数的线性降维方法即嵌入核线性判别法(Kernel Linear Discriminant Analysis,KLDA),来解决最优化的求解过程中Sω为奇异矩阵问题。通过对于4种工业毒害气体的样本数据测试,实验结果显示,KLDA的平均识别率最高为89.06%,最高识别率为92.18%明显高于FLDA和PCA;对于三类算法的测试识别率,同等条件下,KLDA>FLDA>PCA,但是由于算法的复杂度较高,运算耗时较长,尤其对于高维样本数据运算时,算法的综合性能指标会受严重影响。(5)进一步探讨仿生嗅觉系统的复杂数据图谱降维及特征重构问题,本文提出了一种基于多重叠加映射分析(Superposition Mapping Analysis,SMA)算法,详细介绍了所提SMA算法的几何逻辑、数学原理及实现步骤,通过对PEN3电子鼻测量的8种不同产地的木香中药材数据,进行降维处理(共计480组样本,数据维度为57600*7200)及特征空间可视化分析。将SMA与PCA、PCA+FLDA、KLDA等线性算法在特征映射空间、运算时间及识别准确率方面进行了详细的数据对比,实验结果表明,基于SMA的非线性的数据处理方法,在降维映射特征空间分布及识别准确率方面表现突出,其中平均识别准确率为88%,最高识别准确率达94.37%,在时间消耗方面也表现良好,更加适合PEN3电子鼻的信号处理与特征提取。