论文部分内容阅读
随着科技的进步、信息技术的发展、气象预测标准的提高,气象数据日益剧增。由气象变化带来的自然灾害已严重威胁人们的生命财产安全,影响天气变化的因素多而复杂,致使灾害天气的准确预测预报非常困难。如何通过数据挖掘的相关技术挖掘出气象数据中有价值的信息是气象科研人员的一项重要任务。挖掘出的可用信息,不仅能提高天气预报准确率和灾害天气预警能力,还能指导当地的工农业生产和提高人民的生活水平,造福于人民。数据挖掘常用的软件有SAS、SPSS、MATLAB等,开源的软件有WEKA、ARMiner。不同的数据挖掘软件适用于不同的数据模型之中,处理各式各样的关系对象。近年来,数据挖掘在计算机领域的应用也越来越普及,在入侵检测方面,学者开展了很多研究,尤其是分析根据不同协议分析攻击类型,在基于HTTP、TCP、UDP各种协议的攻击检测上,以及在解析DOS、DDOS等攻击类型的检测中。互联网也在使用数据挖掘分析客户点击率、电商则根据点击率分析用户心理及感兴趣的模块,进行针对性的推销。电信根据客户数据的分析,将用户群细分,设置合理套餐,有针对性地进行推销,这些都给企业带来了巨大的利润。数据挖掘中的分类算法被广泛运用到气象预测中,机器学习显示了良好的分类性能。大量研究表明,集成分类器比单个分类器具有更好的分类性能。本文从某市某局部区域出发,使用支持向量机和协同分析方法,研究基于组合分类器的气象数据挖掘的问题,构建了基于SVM的多组合器协同分类模型,通过整合不同的分类器参数和个数,得到不同的数据挖掘分类模型,最终实现整体建模,将样本集输送到各个模型,得到最终分类结果,通过一系列的对比试验,将分类结果可视化的表示出来,直观的可以看到不同模型的分类效果。预期验证模型在分类稳定性和分类准确率方面具有更好的效果。本文主要开展了以下几个方面的研究,包括对局部气象数据特征的分析、国内外研究现状的分析、数据挖掘分类方法的分析、相关技术分析、研究了组合分类器在局部区域气象数据的挖掘,构建和分析了单个SVM分类器模型;构建和分析了基于SVM的Bagging组合分类器模型;构建和分析了基于SVM的Adaboost组合分类器模型。文章对局部区域的气象数据进行了降雨与否的预测,将分类器应用到局部区域的气象数据中进行了当地的降雨预测,比较三个模型之间的准确率和性能优劣。最后,本文引入了KNN算法,构造基分类器,比较了基于KNN算法和基于SVM算法的装袋与提升的集成效果,并从纵向和横向两个方面再一次对文章结论进行了实证与说明。本文的研究成果,为当地的气象局提供了决策依据,为当地居民的社会活动、生活、工作以及为工业生产提供了参考。