基于机器学习算法提高光谱检测效果方法研究

来源 :浙江师范大学 | 被引量 : 0次 | 上传用户:jwz1270
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
激光诱导击穿光谱技术(laser induced breakdown spectroscopy,LIBS)是一种光谱分析技术,其所需组成的设备简单安全,能分析包括气体、液体和固体等的样品物质形态,样品无需预处理或者只要简单的预处理,激光烧蚀的样品量少,可以同时对样品中所有元素的信息进行快速分析。在激光诱导击穿光谱技术分析土壤元素浓度过程中,由于光谱测量过程中存在基体效应、谱线自吸收效应、不同元素谱线之间互相干扰等原因的影响,使得检测结果与真实值之间的差距较大。为了提高LIBS定量分析方法的检测能力,本文提出将机器学习算法应用到LIBS技术定量分析中,构建的了若干种算法模型应用到LIBS技术定量分析中,以提高对土壤元素浓度检测的精度和精密度,研究结果有利于LIBS技术推广到更多的元素含量检测应用中。本文主要研究基于支持向量机、最小二乘支持向量机、相关向量机三种机器学习算法构建LIBS定量分析模型,并讨论其对土壤元素浓度预测的影响。为了使得所得结果更加准确并具有说服力,本文检测的目标元素有Ba、Cr、Ni等3种土壤元素,从不同浓度梯度全方位分析所建立的机器学习算法模型对土壤元素浓度的检测效果。首先,建立支持向量机定量分析模型,建模之前先对光谱数据进行全谱归一化,将峰值强度作为模型输入,并将其预测结果的精密度和精度与传统定量分析方法所得的检测效果进行对比分析,从整体均方根误差角度,支持向量机定量分析模型对高浓度元素Ba的检测效果与传统定量分析方法的结果相比较差,但对于Cr和Ni元素的检测效果,两种定量分析方法结果相差不多。多次重复测量的相对标准偏差,支持向量机模型在大多数预测中均略优于传统定量分析方法,表明支持向量机检测效果的精密度较高。其次,建立最小二乘支持向量机定量分析模型,建模前先对光谱数据进行全谱归一化,将峰值强度作为模型输入,并将其预测结果与传统定量分析方法和支持向量机模型所得结果进行对比分析。结果显示,最小二乘支持向量机定量分析模型预测结果的相对误差大幅减小,检测精度远远高于传统定量分析方法和支持向量机模型,整体预测精度好,但其预测结果的精密度有些偏低。再次,以数据全谱归一化处理后的峰值强度和谱峰面积分别作为模型输入,建立相关向量机定量分析模型,并分析了其对相关向量机模型检测效果的影响。研究发现,将峰值强度作为模型输入建立的相关向量机模型所得的检测结果与支持向量机和最小二乘支持向量机相比,相关向量机模型的预测效果在精度上高于支持向量机,低于最小二乘支持向量机;在精密度上高于支持向量机和最小二乘支持向量机;而以谱峰面积作为模型输入所构建模型的训练和测试效果的精密度和整体预测结果的精度均优于峰值强度作为模型输入的结果。此外,论文还分别以全谱归一化后的谱峰面积以及未全谱归一化后的谱峰面积分别作为输入,建立相关向量机定量分析模型,以全谱归一化后的谱峰面积作为模型输入所构建的模型预测效果的精密度更好,但是预测精度没明显改善。
其他文献
目的:桥本氏甲状腺炎(Hashimoto’s thyroiditis,HT)是一种临床上常见的慢性自身免疫性疾病,其病理损伤主要表现为甲状腺滤泡上皮细胞及甲状腺滤泡腔的受损,导致甲状腺相关自
宽度主要研究某个集合在一定意义下的最佳逼近问题,是逼近论的一个重要研究方向。被逼近集合主要包括抽象空间中的点集合和一些重要的函数类,随着学者们研究的深入,有限维空
背景:神经痛在临床上很常见,因发生机制尚不清楚,尚缺乏有效的治疗手段。神经系统的敏感性升高是神经痛的重要发生机制。近年来发现GABA重摄取系统即GABA转运蛋白可能参与了
多时间尺度耦合效应广泛存在于工程与科学各个领域,具有广泛的应用背景,是当前国内外研究前沿和热点之一。多时间尺度耦合会导致系统更复杂的非线性行为,尤其是其中的簇发振荡现象。因此,探讨多时间尺度耦合系统存在的簇发振荡及其产生机制具有深远的意义。本文以两类多时间尺度耦合系统为例,分析不同的条件下系统动力学的演化行为,主要内容如下:首先,在一个三维混沌系统中引入单个参数激励,然后调节系统参数,使激励频率与
随着媒体数字化技术和网络技术的发展,网络视频数据呈爆炸性增长,如何对海量视频资源进行有效的分析和管理已经成为当前研究的热点。镜头边界检测(shot boundary detection)
近年来,对地观测技术不断发展,遥感卫星数据的空间分辨率提高到亚米级,光谱分辨率提高到5纳米。遥感技术的快速发展极大地促进了遥感数据的应用。与此同时,对遥感数据处理方法的需求也在不断的提高,更高级的数据需要更先进的技术方法。在此背景下,一些学者提出了一些新的算法,如支持向量机、神经网络等等。但是,大部分研究的方向都集中在监督分类算法上。但对于监督遥感分类算法,其精度受到带有类别标记的训练数据集的影响
研究背景:随着社会经济的飞速发展,人类预期寿命不断增加,但是与衰老相关的疾病困扰着绝大多数老年患者,例如阿尔兹海默病和痴呆症,这已经成为世界上最重要的公共卫生问题和
安德森局域化是凝聚态物理学中的一个非常有趣的现象。最初,安德森研究了晶体中的电子受杂质散射,由于散射路径的相干性,当无序强度达到一定程度,电导消失,即安德森局域现象。后来在其它各种波,如光波、微波、超声波,甚至是冷原子体系中都可以观察到这种现象。另外,量子相变也一直是凝聚态物理中一个重要的现象。最近,随着量子信息学的快速发展,科学家们开始越来越广泛地关注从量子信息学的角度来研究自旋链模型中的量子相
辣椒是我国重要的园艺作物,种植面积达150万~160万公顷,约占全国蔬菜种植总面积的10%。辣椒病毒病是危害辣椒生产的重要病害,目前世界上已发现近40种病毒可以侵染辣椒。辣椒
我国近三分之二的土地是丘陵和山区,冲积扇多分布在山前,它与人们的生活生产密切相关,同时冲积扇与泥石流在成因上紧密联系,极易发滑坡和泥石流等地质灾害,并且冲积扇分布区域通常存在松软土,其分布范围对工程地质选址影响较大;在油气方面,可以通过地表冲积扇的勘测进而推测地下冲积扇有利储层。因此在遥感上快速确定冲积扇砾石分布范围,对地质灾害防治、油气勘测及工程地质选址具有重要意义。论文研究了高分一号卫星数据在