随机森林算法在城市空气质量评价中的应用研究

来源 :上海第二工业大学 | 被引量 : 0次 | 上传用户:mirror722
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会经济的快速发展,工业化程度越来越高,城市人口数量迅速增加,空气污染日益严重。如何加强空气污染防治,及时有效的防止严重污染事件发生,是我们越来越关心的问题。为防止城市空气污染事件的发生,保证城市空气质量,我们必须对空气质量进行准确合理的评估。并对于突发事件及时提出有效的防治措施,尽可能的给居民保障一个健康的生活环境。科学有效的空气质量评价方法在确保城市空气质量方面发挥着非常重要的作用。然而,我国的空气质量评价方法目前使用较多的还是传统的空气质量评价方法,而传统的空气质量评价方法一般是从单个污染因子进行考虑,运用固定的公式计算得到的,并且掺和了很多主观因素。而随着大数据和人工智能方法的进步,面对海量的数据,传统方法已经很难满足数据处理效率的。机器学习是一种实现人工智能的方法,如何更好的利用大数据和人工智能来进行空气质量评价,已经成为目前学者专家们的研究热点。随机森林算法是目前一种较好的机器学习评价算法,具有预测准确率高、处理效率快,泛化能力强,不容易过拟合等优点使其在被很多学者专家们运用在很多领域,包括图像分类、故障诊断、交通流预测等领域。本文建立以城市空气质量为背景的空气质量评价模型,先是对评价因子进行选择,对评价标准和现有的空气质量评价方法进行大量的研究。其次,从随机森林算法的的原理和理论知识入手,介绍了算法构建过程并对其优化方法进行了研究,为之后的空气质量评价模型的建立做好铺垫。接下来,选取2014-2016年中我国113个重点环保城市的空气质量数据作为原始数据,通过数据的预处理与数据集划分后,建立基于随机森林的空气质量评价模型,同时通过对模型建立过程中的不平衡数据处理和参数调整两个方面进一步优化模型,并使用准确率和AUC值来评估模型的模型效果;最后,将随机森林算法与人工神经网络和支持向量机进行比较,分别计算它们的准确率和AUC值。实验结果表明随机森林算法的评价效果最好,可以准确有效的对城市的空气质量进行评价,同时通过袋外数据对空气质量评价因子的重要性进行排序,为今后的大气污染防治提供建议。
其他文献
利用分子动力学对高岭石脱水过程进行模拟,并采用密度泛函理论分析其脱水机理.结果表明:在300~600K时高岭石并未发生明显变化,在700K之后高岭石中Al配位数逐渐降低,H配位数逐渐
目的为探讨榕城区精神残疾的主要病种分布、残疾等级情况、相关因素及影响,分析精神残疾与精神疾病之间的关系,为严重精神障碍患者的康复管理治疗提供依据。方法对2021例精神
<正>0.引言建构主义发展观(Concept of Constructivism Development)是在建构主义理论基础上不断创新、发展和完善的学说。它是心理学家对人类学习过程的认知规律不断深入研
会议
阐述了生态系统服务功能研究的产生和发展的过程、研究现状及发展趋势。
目的:探讨低分子右旋糖苷所致不良反应(ADR)的一般规律及特点。方法:对1994年~2006年低分子右旋糖苷不良反应13年间的国内文献源进行统计分析。结果:低分子右旋糖苷的不良反应主要
丙型肝炎病毒(HCV)是一种单股正链RNA病毒,全长约9.6 kb,开放读框区编码结构蛋白和非结构蛋白。全球HCV感染率约为3%,是一种严重威胁人类健康的传染病,在献血者中进行HCV筛查是
通过对牦牛、藏羊瘤胃纤毛虫春、夏、秋、冬四季种群密度变化及主要种属四季构成比例的分析发现 :牦牛、藏羊瘤胃纤毛虫密度大于国内同行对其它地区牛及绵羊的研究结果 ,并且
过去,对旅游的传统认识仅把旅游归在消费领域,谈全域旅游也仅仅是就旅游领域而说旅游,没有把旅游的发展放在中国社会经济大的发展层面上来思考旅游的问题。但随着新时代的到来,旅
报纸
●社会力量投入疫情防控主要容易面临信息不对称、供需不匹配、活动不规范、公众舆论复杂等问题。因此,应完善社会力量参与疫情防控的引导机制,以政府为动员主体,组织协调动
报纸
由王守伦教授、丁子信教授等人撰写的《投资软环境建设与评价研究》一书,2009年11月已由中国社会科学出版社正式出版发行。该专著是根据潍坊市政府重大研究课题“潍坊市外商