居民消费价格指数预测——基于网络搜索数据和LSTM模型

来源 :中央财经大学 | 被引量 : 0次 | 上传用户:xiaozhu222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
居民消费价格指数(CPI)与我国居民日常生活息息相关,反映着国家宏观经济的运行情况,为宏观调控提供参考,对CPI进行准确的预测十分重要。但CPI具有滞后性和非线性时序特征,准确预测难度较高,对CPI的预测研究也成为了难点和热点。CPI预测的方法层面,时间序列等线形模型已经得到广泛应用并取得了一定的研究成果,而随着机器学习和深度学习方法的兴起,非线性的预测模型开始进入研究者的视野。LSTM模型更是因其具有长短期记忆性和良好的学习能力,在预测方面极具优势。CPI预测的数据选取方面,传统的宏观经济变量来源于政府发布,具有时滞性。以百度指数为代表的网络搜索数据可以反映出某一关键词在互联网上搜索的规模和在网民中的关注度,从而映射出消费者的行为和宏观经济情况,体现在商品价格之中。利用网络搜索指数包含的海量、高频信息可以更好地对CPI进行预测。因此本文使用网络搜索数据和LSTM模型对CPI进行预测,从四个方面对研究进行展开。首先对商品价格的影响因素进行分析,从供求关系和宏观因素影响角度构建网络搜索行为与CPI的关联框架,说明使用网络搜索数据预测CPI的可行性。第二部分阐述了与CPI相关的网络搜索关键词库的构建方法以及百度指数数据的获取和处理。根据文献参考和CPI的影响元素、编制方法得到网络搜索种子关键词,再使用需求图谱法和word2vec等文本挖掘方法获取扩展关键词,构建关键词库。得到关键词库后,获取关键词的百度指数日数据,在进行缺失值、异常值处理和去时间趋势处理后,将日数据转变为月数据与CPI月度数据对应。网络搜索数据月度值和CPI月度数据即为用于建模的数据。第三部分,利用TVP-VAR双变量模型探究网络搜索指数对CPI的影响关系,识别各变量对CPI的时变影响大小及滞后性,为模型选择及时间步长参数的设定提供依据。第四部分,通过构建LSTM模型,对CPI进行预测,并通过SHAP方法对变量重要性进行分析,对LSTM模型的可解释性进行探索。在月度预测模型的基础上,用三次样条法将月度数据扩展为旬度数据,建立旬度预测模型。本文的主要研究结论和成果为:第一,本文基于CPI的编制原则和理论经验法确定了预测的种子关键词,在种子关键词的基础上通过文本挖掘技术和需求图谱技术拓展关键词库,在种子关键词的基础上关键词数量扩展了近两倍。且扩展出的关键词与CPI有较强相关关系,能够对预测起到积极作用。第二,使用TVP-VAR模型对网络搜索指数与CPI的影响关系进行探究,结果表明,绝大部分网络搜索指数对CPI有正向持续的显著影响,该影响在滞后6个月时最为显著。第三,将LSTM模型用于CPI的预测,取得了较好的效果。LSTM模型的预测精度,明显优于lasso回归、弹性网络、随机森林、极致梯度提升、梯度提升回归树、支持向量机、BP神经网络7种模型,能有效解决非线性时间序列的预测问题。通过SHAP模型对各特征的重要性进行分析,发现CPI、猪肉和物价上涨的搜索热度对模型的预测较为重要,且有正向影响。通过三次样条抽样扩充数据后建立的旬度CPI预测模型在充分利用高频数据的基础上,能够实现较好拟合。综上所述,本文采用网络搜索数据和LSTM模型预测CPI,丰富了网络数据和深度学习方法在宏观经济研究中的应用。通过文本挖掘法有效拓展了网络搜索指数关键词库,使用TVP-VAR模型分析了网络搜索指数与宏观经济变量的影响关系,基于SHAP模型分析了影响CPI的重要变量,建立了较为精确的LSTM预测模型,对CPI的预测体系进行了补充,为宏观经济调控提供参考。
其他文献
在油气藏形成的过程中输导体系与盖层扮演着至关重要的角色,二者共同约束着油气运移。油气的具体运移路径与沿着动力方向上输导介质与盖层的分布和性质相关,且最终由输导体系和盖层的组合共同决定。前人对于盖层和输导体系做过大量的研究,但输导体系与盖层的研究理念、内容与侧重点存在着很大差异。对于输导体系,前人只考虑了二次运移中的输导体系,未研究初次运移中即烃源岩内部输导体系情况。其次,前人研究仅局限于输导能力最
学位
在上世纪对外开放政策的颁布和施行下,我国的制造业企业依托自身劳动生产要素的低成本优势,迅速加入到全球贸易经济往来的新体系中。在此背景下国家的经济发展呈现“开阔式”推进,然而国内经济发展形势自进入21世纪以来逐渐步入新的阶段,过去以初级生产要素投入为主的“粗放式”发展模式逐渐引发产能过剩、环境污染、资源短缺等一系列棘手问题。这让人不禁反思我国的出口贸易质量及其内涵,相较于纯粹通过测算贸易绝对额用作为
学位
东昆仑造山带近年来被厘定为早古生代高压-超高压变质带。带内广泛出露早古生代的中-高级变质基性岩,这些岩石记录了不同的变质温压和多期的变质年龄,是反演和制约东昆仑早古生代变质演化的重要样品。本文选取东昆仑浪木日地区的石榴斜长角闪岩、榴辉岩及它们的围岩—黑云斜长片麻岩为研究对象,开展了变质岩石学及锆石年代学研究。石榴斜长角闪岩的主要组成矿物为石榴子石、角闪石、斜长石、透辉石和石英,含少量黑云母、绿泥石
学位
健康是人类生存和发展的基础,空气污染是危害国民健康的重要因素。一方面,论文量化了空气质量对医疗支出的影响,有助于提升社会对大气质量的重视,促进改善空气状况和减轻居民医疗负担。另一方面,论文结合分层线性模型和空间自回归模型进行效应估计,使用极大似然法和贝叶斯方法,丰富了分层线性空间自回归模型的参数估计方法,使得个体效应和高层效应、直接效应和间接效应被更好地区分。首先,本文采用文献研究法,总结了空气污
学位
Howardite-Eucrite-Diogenite(简称HED)陨石被认为是灶神星撞击后产生的岩石碎片,是古铜钙长无球粒陨石(Howardite)、钙长辉长无球粒陨石(Eucrite)和古铜辉石无球粒陨石(Diogenite)的统称。灶神星壳部主要由Eucrite陨石组成,壳部岩石在撞击过程中与其他岩石碎块机械拼接形成角砾岩Eucrite陨石。角砾岩Eucrite有丰富的岩相学特征,指示灶神星
学位
<正>1概述1.1项目背景在高层房建施工中,5m以上的基坑被称之为深基坑,施工单位唯有做好支护工作,方可确保地下结构的稳定及安全,但深基坑支护技术的应用难度较高,且基坑的深度越深,则意味高层房建的层高在不断提升,使建筑基础所需承受的重量越大,这便对支护技术提出了更高要求[1]。另外,
期刊
埃迪卡拉纪-寒武纪(E-C)过渡时期地球生物圈经历了多细胞真核藻类的快速演化以及后生动物的起源。然而,对于早期生命这场革命性演化事件背后的原因目前仍存在较大的争议。前人的研究表明该时期的生命演化事件与海洋氮循环演化息息相关。一方面,该时期地球大气和海洋的氧化还原状态可能存在剧烈波动,这对氮的生物地球化学循环过程产生了重大影响,同时可能带来N2O的大量排放,从而引起较为严重的环境效应。但是对于E-C
学位
随着建筑行业的发展,建筑结构逐渐向着更为复杂的高层建筑发展。为了提升建筑结构的稳定性,建筑施工企业有必要加强在房建工程施工过程中深基坑工程施工技术的应用与质量管理工作,进一步提升房建工程的整体施工质量。基于此,文章对深基坑工程进行了简单概述,并分析了相关技术在房建工程中的应用与质量管理的具体措施。
期刊
房建深基坑开挖支护技术是现代房屋建筑工程实施中应用的关键技术。经过理论分析和实践讨论,针对某房建项目深基坑开挖支护技术进行研究。该文总结了深基坑支护基坑开挖、基坑支护以及基坑排水等多项工艺要点,从中把握各项工艺要点,不但对后续的工程施工非常重要,而且有助于深基坑开挖支护工艺的应用推广。
期刊
十九世纪末二十世纪初,在世界发展迎来高度发达的物质文明的同时,自然环境、资源面临崩溃的危机,以“褐色经济”为主导的传统经济模式难以为继。一方面污染物排放和资源过度开发对环境的破坏,引发了温室效应等全球性的生态危机。另一方面对资源的强依赖性导致能耗产业的发展难以长期持续,例如二氧化碳、水资源等面临着供给到顶但仍然无法满足增长的需求。因此,推动经济模式绿色化转型、发展绿色经济是人类必须要走的路。绿色经
学位