论文部分内容阅读
数据挖掘(或知识发现)出现于20世纪80年代末,目前己经成为人工智能和数据库等领域的研究热点。关联规则挖掘是数据挖掘的一个重要分支,并被广泛应用于市场营销、电信、银行等应用领域。随着我国气象信息化事业的不断发展,在气象领域积累了大量的数据。激增的数据背后隐藏着许多重要的信息,如何充分利用这些数据并从中发现有用的、却常被人们忽视的重要信息,已成为科研人员的一项重要任务。气象数据中数据间存在着某些关联,这些隐藏在数据中的联系可以采用不同的方法被挖掘,根据不同的条件挖掘得到。本文概述了数据挖掘的概念、数据挖掘的各种方法和技术及发展趋势,对经典关联规则挖掘算法进行了初步的研究,包括关联规则的概念、种类及挖掘步骤,重点介绍了经典Apriori算法,针对Apriori算法本身存在的问题,目前的专家学者进行了大量的研究工作,提出了一些改进的算法以提高Apriori的效率,论文简要介绍了一些改进算法的思想。在以上研究的基础上,根据现有的沙尘天气相关气象资料,应用关联规则算法对气象数据进行了挖掘,并在实验室环境中得到了基本实现,得到了一些较有意义的数据,发现了气象资料中隐藏的信息,以期为今后更进一步的研究工作奠定基础。总之,在气象数据获取、处理和应用流程中运用数据挖掘理论和技术,发现其中具有内在联系的规则或模式,可以有效地进行气象预测,对灾害性气候(比如:旱灾、涝灾)及时采取防范措施,能够为科学决策提供更好的服务。大量的气象数据为数据挖掘技术应用提供广阔应用前景,数据挖掘也为气象数据的处理提供了有效手段。今后除继续拓展数据挖掘在气象领域的应用范围外,还要不断改进挖掘方法,提高数据挖掘的效率。