论文部分内容阅读
经济波动研究历来是宏观经济研究中的重要课题和热门话题,特别是经济短期波动的预测,更是研究的难点。中国经济波动的研究始于上世纪八十年代,早期主要是借鉴国外学者的研究方法对中国经济周期和经济波动进行分析和探索。学者们根据经济系统运行的惯性利用历史统计调查数据的变化特征及规律,通过建立回归模型进行经济波动的监测和预测。虽然宏观经济统计调查数据的质量逐步提高,但仍存在问卷调查主观性较强,调查的成本高,数据的时效性差,调查样本容量受限等不足。同时,计量模型在预测领域中的应用虽然得到了极大的改进,但应对海量数据和非线性数据特征的拟合受限,导致了经济波动预测误差较大。随着互联网技术、计算机技术和人工智能的飞速发展,给宏观经济波动研究带来了新的曙光,学者们积极探索把互联网大数据和机器学习算法应用于宏观经济研究。研究的重点是网络大数据的提取和信息的处理,研究的难点是厘清经济行为主体产生的网络大数据和经济波动理论的关系与作用机制。因此,在大数据背景下,研究网络搜索数据与经济短期波动的关联机制,寻找经济短期波动的影响因素,充分发挥网络搜索数据在时效性上的优势,探索影响经济短期波动中的长期因素与短期因素的混合作用,并充分利用不同频率数据的特点和神经网络模型的优势,提高经济短期波动预测的时效性与准确性具有重要的理论意义与现实意义。本文的研究内容与方法如下:首先,根据经济波动理论、有限关注理论和行为决策理论等相关理论构建了基于异步混频数据预测中国经济短期波动的理论分析框架。通过经济波动理论分析,行为决策理论分析和网络搜索与经济波动作用机制分析,把基于网络搜索的行为决策理论加入到传统经济波动理论中构建新的理论框架。其次,在梳理学者们现有研究成果的基础上,根据经济波动理论和中国宏观经济发展特征,深入分析了中国经济短期波动与各宏观经济指标间的作用关系。主要从三次产业、三大需求和外部冲击三个方面进行详细分析和阐述,选择了与经济短期波动相关度较高的12个宏观经济指标,利用因子分析合成了长期因子指数。再次,在厘清经济波动与网络搜索关联机制的基础上,运用行为决策理论、有限关注理论和信息不对称理论,从投资者关注、消费者关注、生产者关注和经济政策关注四个维度,利用文本挖掘技术甄选关键词并爬取百度指数数据,合成了四个短期因子关注度指数。然后,结合季度、月度、日度数据的特点构建预测模型,融合长、短期因子指数分别建立自回归模型(AR模型)、自回归分布滞后模型(ARDL模型)、混频数据抽样模型(MIDAS模型)和多阶段异步混频长短期记忆模型(AMP-LSTM模型)。最后,利用构建的各种模型对中国经济短期波动进行实证,综合评估各模型的性能,分析实证结果,给出研究的结论与启示。主要研究成果如下:第一,构建了基于长、短期因子的混频数据经济短期波动理论分析框架。本文从经济波动理论、行为决策理论、有限关注理论和信息不对称理论出发,构建了基于长、短期因子的经济波动理论框架。把长期因子和短期因子共同应用于经济波动研究,注重传统统计调查数据在经济波动中的研究理论基础,较全面系统地分析了影响经济短期波动的各种长期因素。同时,紧跟时下大数据的应用,充分利用网络大数据实时性、高频性和海量性的特点,把基于网络搜索的短期因子纳入到经济短期波动的研究中,由长、短期因子组成的混频数据共同构成了经济短期波动研究的系统分析框架。为后文长期因子和短期因子对经济短期波动的研究提供了理论基础,为构建基于异步混频数据的预测模型指引了方向。第二,厘清了经济短期波动的长期因子并合成了长期因子指数。分别从三次产业构成、三大需求和外部因素对经济短期波动的影响三个方面深入分析经济短期波动作用机制。利用三次产业对GDP增长率的贡献率研究中国经济波动和三次产业的关系。通过消费、投资和净出口对中国经济增长的贡献率剖析三大需求与中国经济增长的关系。从中国在世界主要经济体中消费率、投资率水平分析了消费、投资对中国经济增长的影响。通过对中国经济政策的实施策略研究经济波动与经济政策之间的作用机制。最后分析外部冲击对中国经济短期波动的影响。通过对经济短期波动的长期因子的详细分析,在18个宏观经济指标中选择了12个与经济短期波动高度相关的指标,利用因子分析进行降维和加权的方法合成了长期因子指数(LTFI)。研究发现,其一,从2013年至2019年,中国经济进入了“新常态”,经济发展进入“大缓和”期,但新冠疫情打破了这种平衡;其二、中国经济增长动能逐步转换。2013年以前,中国经济增长动能主要是以投资为主,而此后,消费成为拉动中国经济增长的“压舱石”和“稳定器”;其三,与世界主要经济体相比,中国的消费率偏低,而投资率偏高,这种偏差与欧美发达国家相比更加突出;其四,经济政策对蔚平中国经济波动和应对外部重大冲击具有重要作用;其五,合成的LTFI与我国经济短期波动高度相关,可以作为预测的代理变量。第三,分析了经济短期波动的短期因子并合成了关注度指数。为了弥补长期因子频率相对较低、实时性较差的缺陷,利用行为决策理论、有限关注理论和信息不对称理论研究微观主体的关注行为,充分发挥网络大数据在高频性、实时性和大样本的优势。在网络搜索数据的支持下,通过经济行为主体的网络搜索行为,利用文本挖掘技术提取关键词,刻画经济行为主体的网络关注行为,利用百度搜索指数从投资者关注、消费者关注、生产者关注和经济政策关注四个维度构建了投资者关注度指数(IAI)、消费者关注度指数(CAI)、生产者关注度指数(PAI)和经济政策关注度指数(EPAI)。用于检验短期因子对经济短期波动的辅助预测作用。研究发现,上述构建的四个关注度指数与相应的经济指标具有高度相关性,而且与宏观经济指标具有协整关系和格兰杰因果关系,可以作为经济短期预测的代理变量,为后文验证短期因子关注度指数对经济短期波动的重要作用提供数据支撑。第四,验证了异步混频数据对经济短期波动预测的作用。为了验证本文构建的长、短期因子指数对中国经济短期波动预测的作用,充分展现使用异步混频数据在预测中的优势,利用2011年1月1日至2020年6月30日的数据,对中国经济波动进行了实证研究。以AR模型基准模型,分别建立了ARDL模型、MIDAS模型和AMP-LSTM模型,划分为样本内拟合区间和样本外预测区间,用均方根误差(RMSE)对各模型进行了性能评估。研究表明,从是否使用长、短期因子指数预测效果来看,加入长期因子指数三种模型比基准模型预测误差平均降低了11.4%,加入短期因子指数平均降低了3.4%,而加入长、短期因子指数则平均降低了18.9%。充分说明本文构建的长、短期因子降低了中国经济波动预测误差,而且长期因子指数的改善更加明显,但同时使用长、短期因子指数构建混频数据模型进行波动预测时,其预测误差更小。第五,探索了结合统计计量理论的神经网络模型在经济短期波动中的应用。在预测模型的探索中,把统计计量理论应用于LSTM神经网络模型,构建了AMP-LSTM模型。通过各模型对比实证研究发现,其一,AMP-LSTM模型具有更小的预测误差。与基准AR模型相比AMP-LSTM模型预测误差降低了25.8%,AMP-LSTM模型的使用体现了异步混频数据和神经网络模型建模在经济短期波动预测中的优势。其二,AMP-LSTM模型具有提前预测能力,可以利用季度前30天和前60天的数据进行GDP增长率的预测。通过对比30天、60天和90天的样本内训练误差和样本外预测误差,在使用前60天的数据时效果最好。因此可以提前60天左右公布预测结果,而且可以提前30天公布当季较准确的预测结果。其三,AMP-LSTM模型具有一定的拐点预测能力。通过评估AR模型、ARDL模型、MIDAS模型和AMP-LSTM模型的拐点预测性能发现:各模型的样本内拐点捕捉成功率F1分别为7.7%、31.3%、50%、50%,而样本外F1仅有AMP-LSTM模型为50%,其余模型均为0。综合来看,AMP-LSTM模型在各方面具有相对更好的性能。根据研究结论得到的启示如下:第一,为宏观经济研究提供了更为广阔的思路。通过本文对经济短期波动的研究,已证明网络搜索数据和机器学习方法的有效性,可在宏观经济研究中进行推广应用。第二,要充分挖掘网络大数据的价值,为宏观经济研究服务。与传统统计调查数据相比,网络大数据有实时性、海量性、高频性等特征,可以充分利用网络大数据的优势,结合传统统计调查数据,为宏观经济形势分析服务。