基于少数类过采样的马尾松毛虫发生面积等级预测算法及应用

来源 :北京林业大学 | 被引量 : 0次 | 上传用户:west_fox
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
马尾松毛虫虫害是我国重要的森林病虫害之一,准确的预测预报能有效降低病虫害防治工作成本,提高防治效果。基于经典机器学习算法的林业病虫害预测预报方法无法有效处理样本数量少、分布不均衡、特征维度高的虫害数据,因而在预测样本数量较少的严重级别虫害时准确性有限。少数类过采样能够有效增加模型训练中可用样本的数量、平衡样本空间数据分布,可为林业病虫害准确稳定预测提供思路。因而,本文面向实际林业病虫害防治预警任务需求,针对虫害数据的不平衡性展开研究,重点解决了运用传统机器学习方法建立虫害发生面积等级预测模型时因数据不平衡所导致少数类样本的预测精度有限、泛化能力弱的问题,本文的主要研究工作如下:1.设计了一种马尾松毛虫虫害样本数据库。本文通过国家林业病虫害防治总站和国家气象数据共享中心搜集了广东省4个地区的马尾松毛虫历年发生面积、气象因子等数据,采用组合特征工程对特征数据进行筛选,明确了不同地区影响马尾松毛虫虫害发生的气象因素,为马尾松毛虫虫害发生面积等级预测算法研究的开展提供了素材。2提出了一种基于少数类过采样的马尾松毛虫发生等级预测算法。本文基于合成少数类过采样算法,结合样本排序、自调参k-近邻搜索和集成学习提出了一种改进的虫害发生面积等级分类方法——基于自调参的少数类过采样预测分类算法,本文将该方法应用到马尾松毛虫发生面积等级预测,提升了预测模型的准确性和泛化能力。3.设计了一款马尾松毛虫虫害测报软件。本文基于Python Tkinter模块设计一款面向马尾松毛虫发生面积等级的预测软件。该软件综合了多种机器学习算法,集成了虫害发生面积等级预测、影响因子特征筛选以及预测模型选择等功能,实现了对用户不同应用场景和需求的综合。本文利用UCI公共数据库和实际马尾松毛虫虫害数据对基于自调参的合成少数类过采样分类算法进行实验验证,结果表明,本文所提算法可以提高不平衡数据的分类性能,F-measure、G-mean以及&OC曲线等不平衡数据分类评价指标均优于SMOTE及其部分改进算法,此部分工作可以为虫害预测预报提供参考。马尾松毛虫虫害测报软件可以实现虫害的预测预报,简化了操作流程,为相关的研究工作提供便利。
其他文献
阐述了苍南县“青山白化”问题治理现状,提出了加强宣传教育、认识“青山白化”问题的危害性、建立殡仪服务网络、建立公墓区或墓葬区、建设一支监督管理队伍等治理“青山白化
以Ph3SnCl作为锡源,采用水热合成法制备球花形状的SnO2纳米材料,对产物进行了XRD、SEM表征,以检测产物的结构和微观形貌,并通过紫外吸收光谱对产物进行光催化性能测试.结果表
目的:筛选黄连干预糖尿病并发抑郁症的有效部位。方法:将黄连水煎剂依次用不同溶剂萃取,采用四氧嘧啶联合慢性应激法制备糖尿病并发抑郁症小鼠模型,小鼠随机分为7组,分别为空
【正】 苏:我指的是赫西俄德、荷马和其它诗人所做的,他们做了一些虚构的故事,过去讲给人听,现在还讲给人听。 阿:但是你指的究竟是哪些?你看出他们的什么毛病? 苏:应该指责
期刊
大客户营销,好比一场持久的阵地战,指挥员的大视野,团队出击的大声势,管理支持的大调度,才是制胜的要则。《变局下的工业品企业7大机遇》一书探索了工业品企业成长的新机会,
目的 报道一例临床表现特殊的胰岛β细胞瘤病例,探讨其可能的机制及临床意义。 材料和方法 患者主要临床表现为6年来反复在餐后2~4小时发作严重低血糖,伴有高胰岛素血症,但
荀子的美学思想,建基于“能定能应,夫是之谓成人”的“成人之教”基础上。“成人”唤醒并关注个人与整个族类之间的互生游戏:一方面,美必然涉及每一个个人的情感,甚至是积淀着人类
我国仲裁法自颁布实施以来,在争议解决方面发挥着重要作用,随着我国经济的不断发展,对以仲裁为争议解决的选择需求也逐渐增加。但由于我国仲裁法并未承认临时仲裁制度的合法
目的:探讨分层管理用于重症医学科护理管理的效果。方法:选取2016年1月~2017年2月医院25名重症医学科护理人员为研究对象,根据分层管理实施时间,2016年1~7月实施前为对照组,2
国际冲突是国际政治的本质,理解国际冲突是抑制冲突、营造和平世界的基础。本文通过分析国际冲突的概念、冷战后国际冲突的特点以及冲突爆发的根源,以期对国际冲突有一个系统