基于TS-PCA及位置-尺度模型的空气质量指数预测研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:weiguoliaaaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,经济水平的发展伴随着环境污染的加剧,人们逐渐意识到空气污染对于人体健康的严重性。了解空气质量状况,可以帮助人们更好地制定出行计划,尽量避免在空气质量较差时出行。空气质量指数(AQI)能反映实时的空气情况,AQI越小,说明空气质量越好,越适于出行。在信息高度发达的今天,能准确地对AQI进行分析和预测,对我国的经济和环境有着十分重要的意义。珠江三角洲是我国重要的经济中心,是中国人口集聚最多、经济发展最快、综合实力最强的城市群之一。经济发达的地区,通常人们的出行频率也会更高,所以对珠三角地区的AQI进行预测,进而为人们制定出行建议,在一定程度上有利于人们的健康。本文选取2016年1月1日至2020年6月30日期间内珠三角九个城市的AQI序列进行分析,将前1000个数据作为训练集样本,其余数据作为测试集。目前对AQI的预测可以归为两大类模型:时间序列统计模型和机器学习模型。其中时间序列统计模型可以根据序列维度分为两类:单序列模型和多序列模型。单序列模型如ARMA模型、ARMA-GARCH模型、GARCH类如EGARCH模型、双自回归(DAR)模型、线性双自回归(LDAR)和非对称线性双自回归(ALDAR)模型等。多维时间序列模型主要有VARMA模型和VARMA-GARCH模型等,机器学习模型如支持向量回归(SVR)模型和随机森林(RF)模型等。针对每个地区的单维时间序列,本文先后采用ARMA模型、ARMA-GARCH模型、LDAR模型进行建模与预测,其中模型的定阶由ACF图、PACF图结合AIC/BIC准则进行确定。针对序列中存在的非对称性,采用ARMA-EGARCH模型和ALDAR模型进行拟合。考虑到选取的地区在地域位置和经济发展水平上具有一定的相似性,即不同地区的AQI序列之间可能存在空间相关性。为了利用这种潜在的相关性,同时达到减少参数个数的目的,采用主成分方法(TS-PCA)对九个序列进行降维,最终将九个城市分割为八组,再对降维后的序列拟合多维时间序列模型。最后建立机器学习模型进行预测并与统计模型形成对比。实证表明,ALDAR模型的预测效果良好;经TS-PCA方法处理后再建立的单序列模型,其预测效果优于直接建立单序列模型。
其他文献
报纸
医疗搜索作为广大群众搜索场景下的刚需,是普通用户获取优秀医疗资源最为便捷的渠道。医药领域数据的爆发式增长给研究人员提供了丰富的知识,是重要的研究资源。医疗搜索的重点就是从海量庞杂的医药领域数据中快速高效地获取信息,而命名实体关系抽取就是文本数据处理工作中一项基础且重要的环节。在医药领域内,准确识别说明书中的禁忌症和适应症实体对于构建合理用药规则,构建完善的医药领域知识库有重要意义。但是,由于医药领
学位
多重检验是目前高维统计推断的领域中研究的热点之一,并在临床医学、基因检测、教育学等多领域中均有广泛的应用。同时对多个假设进行检验是多重检验的实质,它常常被用来对来自大量总体的某个参数或多个参数的水平进行比较。当多重检验中的一个假设被拒绝,我们通常希望对该参数构造置信区间,从而确定该假设对应真值的取值范围。我们将多重检验中被拒绝的假设对应的参数称为选择后参数,为选择后参数构造能控制FCR的置信区间也
学位
“碳标签”(Carbon Labelling)是一种将商品在生产、流通过程中排放的温室气体排放量,在产品标签上用量化指数标示出来的方法。全球已有11个国家正在积极建立“碳标签”制度。我国也已经形成了相关的团体标准和试点成果。“碳标签”的形成涉及产品生产、加工、流通过程中的多个环节,导致碳数据归集困难、真实性难以保障和易被篡改。为此,本文提出一种基于区块链和隐私计算技术,从供应链的视角构建“碳标签”
期刊
随着位置采集和移动通信技术的不断进步,每天有大量的轨迹数据被采集并收录,因此在过去的十数年中,轨迹数据挖掘工作进展迅速,而异常轨迹检测是其中很重要的一部分。目前中国的汽车保有量、销售量都位于世界前列,与此同时,国家重大专项中的车联网项目正在大力发展中,车辆轨迹数据是日常能接触到的最广泛、最普遍的轨迹数据之一。本文研究的问题是通过轨迹数据挖掘来进行轨迹异常检测,即使用一个地区车辆出租公司出租出去的车
学位
随着大数据时代的发展,尤其是深度学习的研究,使得人工智能产品逐渐进入人们的视野,而图像描述则是近年来一大研究热点,可应用于网络图片数量爆炸式增长背景下的图像检索,也可应用于自动驾驶技术中的交通标志描述,还可应用于医疗领域中视觉障碍人士的生活辅助等等。图像描述任务是一种融合了图像信息和文本信息的多模态任务,目的是使计算机自动生成一句对图片的文本描述,因此如何准确提取图像特征、生成可读性高且准确的文本
学位
民以食为天,食品饮料作为必须消费品的主要成分,一直以来以市场广阔、技术更新迭代慢、利润稳定等特点,在金融市场中颇受投资者的喜爱。我国金融市场虽然起步较晚,相比欧美等发达国家的金融市场还有较大差距,但随着我国改革开放和世界经济全球化发展,我国的金融业发展迅速。而且随着科技的发展,数据搜集变得越发容易了,我们可以轻易地提取股票市场的各种交易数据,这些数据具备大量、高频等特点,可以反映一个国家或地区的经
学位
多模态学习是当下机器学习中特殊且重要的一类,旨在利用多种模态的数据信息采用机器学习方法进行信息挖掘和预测的学习方法。其常用的技术方向分为多模态表示学习,多模态翻译,多模态对齐,多模态融合,多模态协同学习等。其中,多模态融合是多模态学习的重要部分,通常在决策型任务中对模型的效果起着至关重要的作用,与多模态表示学习和多模态对齐有着不可分割的关系。多模态融合在过往的研究中通常依照融合时间分为早期融合、中
学位
在基因组学的下一代测序技术研究过程中涉及到一个单变量与高维随机向量之间的独立性检验问题,为了更好地解决这个问题,我们从统计学的相关理论知识出发,提出一个统计量来对其进行检验。鉴于变量相关性在统计学研究中的重要意义,本文首先介绍了几种常用于独立性检验的相关系数,包括皮尔森积矩相关系数、斯皮尔曼秩相关系数和距离相关系数等。通过一系列模拟比较,说明距离相关系数在揭示两变量间非线性关系时有着独到的优越性。
学位
<正>与发达国家相比,我国人口老龄化发展趋势具有较强的中国特色,为商业养老保险提供了巨大的发展空间,也带来新的问题和挑战。国家“十四五”规划将应对人口老龄化上升为国家战略,构建多层次、多支柱养老保险体系成为应对人口老龄化的重要举措。
期刊