论文部分内容阅读
随着信息技术的高速发展,农业信息网站虽可以提供信息浏览、查询、数据下载功能,但并不能对数据进行动态的分析、预测,已有的数据挖掘工具虽然功能强大,但是专业性太强,对普通农业人员来说并不适用。本文针对目前农业系统存在的问题,构建了基于数据挖掘的智慧农业生产系统,以数据挖掘算法为研究核心,实现了地力等级分析和产量预测等功能,并且挖掘过程在系统内部进行,用户只需简单操作即可实现对数据的动态分析。本文主要研究内容如下:(1)通过对国内外相关现状的研究,分析并总结了我国在农业系统中应用数据挖掘技术时存在的问题,确定了论文研究的主要内容,并对系统相关技术及理论进行了介绍,为系统的实现提供了保障。(2)针对农业系统地力等级数据的特点,分析了决策树相关算法的优劣,选取C4.5算法构建分类模型,同时针对C4.5算法存在的问题,提出了改进的K-C4.5p算法,用K-means聚类算法首先将连续属性离散化以解决C4.5算法在处理连续属性时的低效率,再用Pearson相关系数代替信息增益率进行分割属性的选择以解决过拟合问题并提高分类准确率,通过实验证明,K-C4.5p算法在时间和准确率上都有了大幅提升。(3)针对农业系统产量数据的特点,分析了多元回归算法原理,并针对多元回归算法存在的问题,提出了改进的残差主成分回归算法,在对原始影响因子提取m个主成分后,将一次回归后的残差作为第m+1个主成分并再次回归建模。通过实验证明,残差主成分回归模型与传统的多元回归模型相比,复杂度低且准确率较高,因此残差主成分回归算法更适合用于产量预测。(4)根据智慧农业生产系统的设计目标,对系统进行了总体设计和详细设计,并完成了系统的开发。通过对系统的展示,验证了系统不仅可以实现对农业生产数据的基本管理,而且能够通过地力等级分析和产量预测两个模块实现数据挖掘功能,各功能模块均达到预期效果,可以实现对农业生产数据进行动态地分析和预测。