基于三种监督学习算法的降雨预测

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:samallhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
明天是否下雨是人们日常关心的话题,在机器学习中可以把它看作是一个二分类问题并利用一些算法来对明天是否下雨进行预测。本文采取支持向量机(SVM),Adaboost(Adaptive Boosting)及决策树算法(Decision Tree)中的C5.0分别利用澳大利亚八年的天气数据建立模型并对明天是否下雨进行分析与预测。获得大量数据时难免会遇上缺失值,本文为了减少数据信息的损失,采用了K近邻法将整个数据框作为参数,对缺失部分进行填补后再进行建模。在处理样本不平衡时,由于下雨与不下雨的样本量存在一定差异,建模之前使用欠采样平衡样本,而数据的描述性分析在原数据集上进行。本文依次使用了SVM,Adaboost,C5.0。SVM先试了几种核函数,并且调整核函数参数再次进行模型拟合最终得到一个高斯核的最优划分超平面。Adaboost先初步拟合,再进行决策树优化,调整最优树的棵数以及树深再次搭建模型,从而得到一个效果更好的分类器。最后使用C5.0,该算法在C4.5的基础上增加迭代次数并引入代价矩阵对后果更严重的误判进行惩罚来提高模型的性能。为了避免因样本划分带来的随机误差以及过拟合,采用十折交叉验证来求得各个模型的准确率,并对模型性能指标,如查全率,查准率,假正例率,F1-score和Kappa值等进行比较分析。并采用非参数检验来进一步比较SVM,Adaboost,C5.0的拟合效果的好坏。最终得出带有高斯核函数的支持向量机模型预测准确度最高。
其他文献
学位
目的:从理论分析及临床观察两方面探讨痰瘀同治治疗突发性耳聋的临床意义。形成痰瘀同治治疗突发性耳聋的中医研究思路。方法:1.理论研究:深入探讨痰瘀形成的机理,痰瘀同源、痰瘀同治的理论基础,及痰瘀与突聋发病的关系。2.临床研究:将符合痰瘀互结型的突聋患者60例,随机分为治疗组和对照组。治疗组予化痰祛瘀方加减口服,对照组予奥勃兰、欣可来口服,两组均予常规治疗(麦普宁、申捷静脉给药),两组的治疗疗程均为1
为了解决经典集合问题和不确定性集合问题,1999年俄国学者Molodtsov定义了软集的概念.由于软集理论在实际应用中的巨大潜力,众多学者对其格外青睐.在短短几十年中,大量关于软
团簇是由几个乃至上千个原子、分子或离子通过物理或化学结合力组成的相对稳定的微观或亚微观聚集体,其物理和化学性质随所含的原子数目的不同而变化。团簇作为介于原子、分
天然含水介质中含有大量胶体颗粒,可以携带污染物,并且能促进或抑制其在含水介质中的运移。因此研究铵在地下水环境中迁移及转化规律就显得尤为重要。本论文通过室内土柱试验
近年来,大数据和“互联网+”的概念已影响到社会经济活动的多个行业,成为信息技术融合应用的新焦点和热点,商业银行内部审计部门也同样面临新的形势和挑战。许多银行顺应时代
1965年L. A. Zadeh提出了模糊集的概念,标志着模糊数学的诞生.在1973年,Zadeh又将模糊数学的思想和方法应用于模糊推理,并取得了巨大的成功.近年来,把理想和滤子理论等应用到
目前关于青藏高原的隆升历史和过程的研究大多是通过化石、沉积学、层序地层学以及古地磁的方法来完成的(徐仁等,1973;An,2001;Tapponnier,2003)。最新的研究成果(Wang,2008,
社区不仅是现代人开展社会生活的基础单元,也是当前国家与人民在政治诉求、经济发展以及文化生活的基本交汇点。随着中国经济步入新常态,社会经济结构、产业模式都发生巨大变
近年来上转换和量子剪裁发光材料得到了广泛地关注和研究。上转换发光材料在近红外探测等领域有广泛应用。量子剪裁发光材料有望在等离子平板显示、高效太阳能电池等领域得到