论文部分内容阅读
农业生产信息决策支持系统是以现代信息技术手段,针对农业领域的半结构化决策问题而建立的为农业管理人员、农业科研工作者和广大农民做出正确决策提供帮助的人机交互系统。由于农业生产信息集数据量大、涉及因素复杂、涵盖面十分广泛等,使得农业生产信息决策支持系统的知识发现研究存在一定的困难。目前,农业领域的知识发现研究主要使用模糊集理论、遗传算法等方法。但由于这些技术在得到决策规则和推理过程中都需要数据先验知识的介入,而且获取的结果也不易于评价和解释,造成知识获取的“瓶颈”问题。 粗糙集理论是由波兰数学家Z.Pawlak于20世纪80年代初提出的,是一种新的处理模糊和不确定性知识的数学工具,它是在无需提供数据的先验知识基础上,以从分类的观点、集合近似、近似分类与不可分辨性的概念为基础,通过知识约简,导出问题的决策或分类规则,它已经在机器学习、决策分析、过程控制、模式识别与数据挖掘等领域获得了广泛的应用。 与传统的不确定数据处理方法相比,粗糙集理论其最大的特点是无需提供数据的任何先验知识,因此对问题的不确定性描述较为客观。为此可以利用粗糙集理论来解决在农业领域的知识发现中的不易于评价和解释缺陷,解决知识获取中的难题。本文探讨了智能决策支持系统中的知识表达以及根据粗集理论分析处理海量信息中信息的有用特征并对其进行提取,并通过分析、推理、简化产生最小决策规则。另外利用粗集理论中的决策逻辑构造了决策表表达知识化简的算法,形成了从粗集理论到决策知识实际化简。并围绕如何根据农业领域的数据特性实现其知识发现,展开研究和讨论,提出了基于粗糙集理论的农业决策支持系统知识发现方案。 本论文的研究思路是按照知识发现的基本步骤进行的:(1) 理解该领域知识和相关的先验知识,明确系统目标;(2) 进行数据整理和预处理,包括不完整数据的补齐、不精确数据的定性描述和数据的离散化、模糊化处理等;(3) 利用某种数据处理方法对数据进行简化,确定系统的有用特征参数或变量,化简系统并建立相应的数学模型或逻辑规则;(4) 测试从数据中挖掘或建立的数学模型或逻辑规则,并解释得到的模式结果,并进一步加工、综合系统,运用挖掘到的知识来解决客观问题。 基于上述从数据中挖掘知识的特点和任务,目前广泛采用的数据处理方法有粗糙集理论方法、概率统计方法、模糊逻辑方法、人工神经网络方法、聚类分析方法、遗传算法、回归优化等。对不准确、不完整、不确定数据的知识发现,由于粗糙集理论具有有效地提取最佳分类特征,运算量小,精度高,并消除冗余属性等特点,在农业领域数据的知识发现中具有一定的优势,本文重点研究了粗糙集理论运用于知识发现中的数据预处理、数据约简、规则提取和系统的增量式学习,并提出了基于粗糙集理论的决策支持系统知识发现模型。主要研究内容和成果包括以下几个方面: