基于半监督的特征选择及其在豆类病害分类研究

来源 :江西农业大学 | 被引量 : 0次 | 上传用户:li2008shuai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在我国经济体系中,农业占据至关重要的地位,但农作物病害是制约“农业增效、粮食增产、农民增收”的原因之一,现可见的病害种类有1400种以上之多,若病害爆发则会导致社会经济的非健康发展。目前,豆类在农作物中的占比增大,其中豆科作物不仅需要面对环境的考验,还需要面临大量病害类别造成的产量锐减问题,同时,随着病害种类的增多,对于病害类别标注需要耗费大量的人力、物力等资源。目前为止,种植豆科作物的人员主要还是农民,无法精确识别病害种类,因此对病害进行分类研究可以帮助专业性不足人员进行辨别病害类别。面对此类复杂情况,本文采用半监督特征选择方法对豆类数据分析并处理。本文以现实生活中豆类数据集在半监督学习情景下的分类研究为突破口,围绕数据中的高维特征数据的特征选择、半监督学习、豆类病害分类研究等关键问题,研究新型半监督特征选择算法,在此基础上构建出豆类病害分类研究的半监督特征选择框架,并在公共数据集UCI上进行实验。论文的主要研究工作如下:1.针对半监督数据中标记数据过少的情况,本文结合粒计算理论提出了一种新型的半监督特征选择方法,有效的降低了特征维度以及提高了分类性能。目前数据标注的代价过于昂贵,且半监督学习较难处理高维数据任务。针对上述复杂应用的情况,以粒计算方法为基础,提出了基于一致性和知识粒度的半监督特征选择方法。利用正域的依赖度衡量有标记数据的一致性,同时采用知识粒度对未标记数据进行数据粒化去评价特征对样本空间的可区分性。在此基础上,结合数据分布情况提出一种新型半监督学习度量特征重要性的方法。最后,在UCI数据集上,通过实验对比分析表明,Semi-CG(基于一致性和知识粒度的半监督特征选择算法)的平均分类精度较比其他当前四种对比方法高。2.考虑到更好的挖掘未标记数据的特征信息,基于辨识矩阵方法提出一种新型的半监督特征选择框架(GSSF)。在所提出的框架中,根据可辨识矩阵中特征与标记之间相关性获得每个标记类别的不可辨识特征。此外,提出了一种评估指标来评估特征在半监督数据上的可区分性,其中未标记数据上特征的重要度是通过特征和不可辨识特征之间的互信息分析得出。最后,将所提出算法的性能与四种当前的半监督特征选择方法进行了分类性能的比较。实验结果验证了此算法在真实数据中的有效性。3.以本文提出的GSSF方法作为豆类病害分类研究的算法基础。以公共数据集UCI中豆类真实数据集作为样本;使用不同占比的标记数据和相应的无标记数据作为实验的输入;采用GSSF方法对该数据进行分类研究。实验结果标明,该算法较比其他当前四种对比方法在特征选择结果下的分类性能优异。综上所述,为了解决实际中豆类病害的分类研究的问题,结合了半监督学习、粒计算理论及应用分析等研究内容,提出几种新型的半监督特征选择方法。通过实验分析可得出,豆类病害分类研究的分类性能主要取决于分类算法以及特征选择方法,其中,精确的半监督数据信息能够提高识别的准确率以及分类性能,并且有效的特征选择算法可以降低其计算复杂度。
其他文献
随着生猪养殖业的规模化程度越来越高,对计算机技术的各方面需求也随之增加。为提高生猪养殖业的信息化水平,需改进传统方式中获取猪体重困难、易导致猪应激现象发生等问题,实现高效快速的生猪体重估测。本研究基于机器视觉与机器学习相结合的方式,提出使用Mask R-CNN实例分割算法实现猪轮廓分割,获取猪图像特征信息,利用Stacking模型拟合猪图像特征与体重关系,实现猪体重估测。本研究主要工作内容如下:(
学位
针对从微观环境下探究植物器官形态建成机理,近年来通过计算机技术对植物细胞生长仿真取得了丰硕成果,然而大部分工作集中在建立细胞二维、静态的几何模型。植物细胞扩张与变形是直接受本身物理力学作用的动态演化过程,为此本研究提出了一种基于物理力学的植物细胞三维动态仿真模型,并基于QT实现了人机交互的仿真平台。首先,采用半边数据结构构建了植物细胞轮廓的拓扑结构,并设计了其顶点、边界、面片查询算法。其次,根据双
学位
秀珍菇口味鲜爽,营养物质丰富,富含蛋白质、维生素和微量元素,且具有一定的防癌抗癌、增强人体免疫力功效越来越受到消费者的青睐,市场对秀珍菇的需求逐年增加。特别是近年来随着生活水平的提高,人们已从“吃饱”逐渐转向“吃好”,这对秀珍菇的品质也提出了更高的要求。传统秀珍菇优良品种选育工作主要通过一些方法(如紫外线照射等)进行诱变处理后再采用人工方式观察形态等相关农艺性状,从大量对象中筛选出符合要求的样本。
学位
水稻是我国的重要粮食作物,但在其生长各个阶段都容易承担虫害的风险,导致产量受到影响危及国家的粮食安全,水稻害虫的检测识别和防治迫在眉睫。传统的水稻害虫检测主要通过人工肉眼观察的方式,主观性强且难以推广,无法满足实际的害虫检测需求。随着计算机视觉和深度学习的快速发展,为基于深度学习的水稻害虫检测提供了充分的支持。本文针对水稻害虫易受复杂背景干扰且小目标害虫难于检测的问题展开研究,主要研究内容如下:(
学位
反应器堆肥取代传统开放式堆肥方式已经在好氧堆肥领域成为了必然趋势。本文针对影响好氧堆肥反应器的关键结构——通风搅拌机构的分散性能进行优化设计。本文借助一种分散性能好的堆肥反应器通风搅拌机构,通过CFD数值模拟,对通风搅拌机构的搅拌桨叶叶片层数、叶片斜面安放角、叶片搅拌半径等主要的结构参数进行性能测验,并在此基础上,进行正交优化,选择更好的结构参数组合。本文主要内容与结论如下:(1)使用Solidw
学位
我国是世界蔬菜生产和消费第一大国,目前蔬菜生产已经成为我国种植业中仅次于粮食的第二大农作物,然而蔬菜生产过程中病虫害不仅影响蔬菜外观,还影响其长势、产量及质量。目前,蔬菜病虫害防控仍大多采用化学农药,施药技术落后,在蔬菜行距、株距较大的情况下使用连续喷雾,喷头无法对靶施药,且施药次数较多,出现大量药液无效沉积且流失到空气土壤,农药利用率低且浪费严重,造成环境污染、叶面农药残留超标。针对以上问题,本
学位
作为世界上最大的生猪生产和消费国,我国在十四五养殖业规划中提出猪肉自给率保持在95%左右的产品保障目标,我国的生猪养殖模式已转向大规模机械化发展。目前母猪发情检测是由人工驱赶公猪,需要多人协作才能完成,不仅查情效率低,同时也增加疾病传染的风险。本文设计的公猪查情遥控电动小车是提高查情效率、降低疾病传染风险的关键性设施,同时也是促使我国生猪养殖模式转向智能化的重要条件,本设计对于发展我国生猪养殖业具
学位
我国是柑橘出产大国,柑橘分选的速度与精确度直接影响到我国柑橘在国际市场上的竞争力。目前我国柑橘分选主要依靠人工完成,该方法不仅消耗了大量劳动力资源而且分级精度不高、分级效率低。现如今国内虽已经有一些水果无损检测分级生产线,但这些生产线大多体型大、价格贵,且具有检测内部或理化品质的设备大多依靠近红外、高光谱技术,使之更加昂贵与难以维护。南丰蜜桔是南方特色优势水果,鉴于我国主要的南丰蜜桔种植多以个体农
学位
为了解决雨雾天收割水稻时,水稻由于表层呈现高湿状态导致收割机输送机构和脱粒清选装置堵塞,潮湿稻草夹带谷粒从而引起额外的浪费损失的问题,提高联合收割机的热效率及利用率,减少稻谷的霉变损失,提出了利用收割机余热在割台以及水稻输送器处两部位采用热风干燥水稻实现水稻机收的方案,并针对在联合收割机割台进行热风干燥水稻做出了一系列研究:(1)基于水稻传热传质理论及内燃机余热回收的计算,进行了收割机余热在机干燥
学位
农产品在种植过程中存在农药使用不合理及滥用行为,导致农产品中存在严重农药残留问题。经典化学检测方法灵敏度高,但前处理复杂、成本高,需要专业人员操作。电化学检测技术具有检测速度快、灵敏度高,且易于集成化和小型化等优点,广泛用于质量安全快速检测。本文探讨农产品中农药残留电化学快速检测方法,结合循环伏安法(CV)和差分脉冲伏安法(DPV),开发一套基于智能手机的便携式电化学检测系统。主要研究内容如下:(
学位