自动编码器的改进算法研究及其在基于高光谱图像的大米蛋白质含量检测中的应用

来源 :江苏大学 | 被引量 : 3次 | 上传用户:gaogaozai11111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着人工智能技术的发展,深度学习受到越来越多专业学者的关注。自动编码器是一种典型的深度学习算法,堆叠自动编码器通过将多个自动编码器堆叠级联而成,以其优秀的特征提取能力被广泛应用于高维数据的降维处理中,尤其是非线性数据的处理,效果良好。但是在堆叠自动编码器数据降维中,无法评估提取的信息是否包含噪声。低秩矩阵恢复算法通过矩阵分解获取数据的低秩成分,从而实现了数据降噪。本文结合堆叠自动编码器的降维优势和低秩矩阵恢复算法的降噪优势,提出一种自动编码器的改进算法—低秩自动编码器算法,通过提取数据的深度鲁棒特征,提升自动编码器的算法性能。
  我国是大米的生产大国和消费大国,蛋白质含量是大米营养价值的重要指标,高光谱图像技术可以实现大米蛋白质含量的无损检测,但高光谱图像数据量大,且各波段间的信息具有较强的相关性,传统的线性降维手段在非线性数据降维上无法满足要求,同时高光谱图像夹杂的噪声也制约着最终分析的效果。本文以大米为研究对象,应用低秩自动编码器学习大米样本高光谱图像的深度鲁棒特征,并采用支持向量机回归构建大米样本蛋白质含量分析模型,实现了快速、精确、无损的大米蛋白质含量检测,验证了低秩自动编码器的高效性。具体研究内容和结论如下:
  (1)研究了自动编码器的原理并进行了算法改进。自动编码器具有优秀的特征提取能力,堆叠自动编码器通过将多个自动编码器进行堆叠级联而成,大幅提升了算法性能。应用低秩矩阵恢复算法于数据降噪的研究日趋成熟。本文结合堆叠自动编码器和低秩矩阵恢复算法,提出低秩自动编码器算法,在堆叠自动编码器训练网络的每一层隐含层训练前加入了低秩分解层,提取每一层神经元数据低秩或近似低秩的结构,该结构去除了大量噪声,然后进行相应隐含层数据的训练,设置合适的编码网络层数及各层神经元个数等参数,采用逐层贪婪训练法训练网络,最终提取最后一层隐含层的神经元信息,即训练数据的深度鲁棒特征。
  (2)获取了大米样本高光谱图像的光谱信息和图像信息。采集420个大米样本的高光谱图像(400-1000nm),获取感兴趣区域内平均光谱值作为样本的光谱信息,同时,分离感兴趣区域内各波段图像,每个样本得到478幅单波段图像,作为样本的图像信息。
  (3)从光谱信息、图像信息及光谱-图像融合信息三个角度出发,采用主成分分析、堆叠自动编码器和低秩自动编码器三种算法分别进行了特征提取,并结合支持向量机回归构建预测模型,以各模型效果为准,评估三种算法的特征提取性能。
  第一,基于光谱信息的光谱特征构建预测模型。在特征提取前,对原始高光谱采用SG预处理,从而减少了采集过程中各种噪声的影响,然后基于三种特征提取方法提取的特征,构建大米蛋白质含量预测模型。结果显示,基于低秩自动编码器提取的深度鲁棒光谱特征建立的模型预测效果最佳,R2C为0.9926,RMSEC为0.0437,R2P为0.9394,RMSEP为0.1232。
  第二,基于图像信息的图像特征构建预测模型。首先对获取的图像统一尺寸并转换为28像素×28像素的灰度图,进一步对灰度图作扁平化处理,变换为784维的列向量,然后基于三种特征提取方法提取的特征,构建大米蛋白质含量预测模型。结果同样显示,基于低秩自动编码器提取的深度鲁棒图像特征建立的模型预测效果最佳,R2C为0.9569,RMSEC为0.0860,R2P为0.8769,RMSEP为0.3394。
  第三,基于光谱-图像融合信息的融合特征构建预测模型。将478维的光谱信息和784维的图像信息进行有机融合,形成1262维的光谱-图像融合信息,基于三种特征提取方法提取的特征,构建大米蛋白质含量预测模型。结果显示,基于低秩自动编码器提取的深度鲁棒融合特征建立的模型预测效果同样最佳,R2C为0.9931,RMSEC为0.04,R2P为0.9619,RMSEP为0.0854。
  纵观三种模型,相较于主成分分析法和堆叠自动编码器,基于低秩自动编码器提取特征建模的性能最好,验证了低秩自动编码器的高效性。同时,基于光谱-图像融合信息的深度鲁棒融合特征建模的效果是三个模型中最佳的,说明基于高光谱图像光谱信息和图像信息的融合信息进行特征提取,建立分析模型,能够实现更高效率的大米蛋白质含量快速、精确、无损检测。
其他文献
扬子鳄(Alligator sinensis)是我国特有的一种小型鳄鱼,因其野外种群数量稀少而被我国列为国家一级重点保护动物,并在安徽宣城建立了扬子鳄繁殖研究中心进行人工养殖研究。目前,对扬子鳄摄食与生长的内分泌调控机制尚知之甚少。研究表明,食欲素(Orexin)、胃促生长素(Ghrelin)和胃泌素释放肽(GRP)在脊椎动物的食欲调节中发挥重要作用,本实验首次对这3种食欲调节激素及其受体(Ore
学位
矿产资源的开采对地表环境造成极大的破坏,土壤养分流失、土地荒漠化、生态污染问题尤为严重,南方稀土尾矿恢复一直是矿山环境恢复治理的难点。生物土壤结皮在恶劣生境中具有抗逆性,固碳氮能力出众,能够为稀土尾矿的生态重建创造基本条件。然而,稀土尾矿区生物土壤结皮对土壤微生物群落的影响及其机制尚不清楚。因此,本文以赣南离子型稀土矿区为研究对象,采用野外调查采样、室内试验分析和高通量测序技术,研究了稀土矿区五种
学位
糜子(Panicum miliaceum L.)是禾本科黍属,既有耐旱、耐热、喜温、耐瘠、早熟等特性,又有食用、药用、饲料等价值,是典型的抗旱耐瘠作物。目前对糜子资源的认识,收集,保存,鉴定与评价工作的缺乏,是制约新疆糜子产业发展的根本性问题。进行糜子种质资源综合鉴定的研究,可以全面认识各种质材料的特征并获得优良的基因资源,提高糜子育种效率。本研究以新疆糜子为主要研究材料,从周围不同地区引进糜子种
学位
玉木耳(Auricularia cornea Ehrenb.)为真菌界(Fungi),担子菌门(Basidiomycot a),蘑菇纲(Agaricomycetes),木耳目(Auriculariales),木耳科(Auriculariaceae),木耳属(Auricularia),是毛木耳的一个变型,目前已在吉林、辽宁、山东、浙江、新疆、广西等地栽培成功。玉木耳的栽培基质主要为木屑、棉籽壳等,近
学位
微生物生态学(Microbialecology)研究的主要问题是微生物与环境之间的相互作用。在自然微生物群落中,微生物的生存与进化常受到所处生物环境(Biotic environment)与非生物环境(Abioticenvironment)的影响。受限于自然微生物群落复杂的背景因素,过去的微生物生态学中关于微生物与环境间相互作用机制的研究常受到一定制约。在此背景下,有研究者利用合成生物学手段构建了
学位
先进航空发动机对推重比的追求加速了高性能材料的研发,先进复合材料的出现为航空发动机部件的材料提供了新的选择。目前碳纤维增强树脂基层合复合材料机匣以及钛合金叶片已在我国航空发动机上获得应用,从今后技术发展看,可能采用碳纤维增强树脂基编织复合材料机匣和编织复合材料叶片。同时,结构的改进对航空发动机的可靠性也起到了至关重要的作用,连接结构的材料组合及结构类型是影响叶片与机匣连接结构静强度的两个至关重要的
工业生产中产生着大量的中高温烟气余热,对这部分余热资源作动力回收,有助于减小化石能源消耗,从而缓解能源短缺压力,减少化石燃料燃烧的环境污染和温室气体CO2排放。本文着眼于初温为200-700 ℃的烟气余热的动力回收,针对现有动力循环-工质组合存在的循环吸热过程与中高温烟气余热源放热过程温度匹配性不足和工质热稳定性与中高温工况匹配性不足,从而影响给定余热源净输出功率的问题,以单位质量流量烟气的系统净
情绪,作为一种短暂而强烈的对外反应,影响人类的生理和心理状态,在人类生活中起着非常重要的作用。情绪识别研究受到了广泛关注,其在医疗、安全驾驶、社会安全等领域都有所应用。相较于外在的物理信号,生理信号直接由神经系统(中枢神经系统、周围神经系统)产生以及控制,人的主观意识难以对其控制,其识别结果更具客观性。因此,本文的研究内容是基于生理信号的情绪识别。目前,基于生理信号的情绪识别研究存在两个局限性。(
学位
视觉目标跟踪是计算机视觉领域中的热门研究之一,在智能监控、人机交互、安防监控等领域具有广泛的应用场景。近年来,虽然研究人员已经提出了大量优秀的视觉目标跟踪算法,但是实现一个鲁棒的实时视觉跟踪算法依然极具挑战性。视觉目标跟踪的挑战主要来源于跟踪场景的复杂性和多变性(如相似干扰物,局部遮挡)和视觉跟踪算法自身的缺陷。视觉跟踪算法设计的难点在于精度和效率之间的平衡。本文主要围绕基于孪生网络的实时视觉目标
这篇文章致力于研究新型改进的调制方案,包括索引调制下的正交频分复用技术,扩频技术以及同相正交技术,用以提高误码率的性能和频谱效率。首先,我们定义一个新的系统模型,叫做基于索引调制和扩频的正交频分复用技术。这一技术是一种新近提出的方案,它的原理是在信号发送之前,从一个扩频码域集中选出多个扩频码,用来传输额外信息比特(以索引的形式)。我们把基于索引调制和扩频的正交频分复用技术和基于同相正交索引调制的正