论文部分内容阅读
摘 要:宏观经济条件下的经济预测分析比较偏向于应用大数据技术与互联网技术,发挥技术的优势获得更精准的预测分析结果。大数据技术可以帮助政府客观评判整体经济形势大致走向,为国家战略发展提供丰富的数据资源。目前大数据技术在应用时存一定限制,本文以此为基础阐述宏观经济预测中的缺陷问题,通过数据来源、数据获取、数据分析等方面实现大数据的有效应用。
关键词:大数据;宏观经济;预测分析;数据获取
实际上,宏观经济预测中包含的内容十分广泛,大数据技术可以为政府提供多层次经济预测信息,同时对信息综合处理和加工。我国提出了将大数据、云计算用于数据分析的要求,促使宏观经济信息可以及时反馈给各个部门,加强各部门高效联动。大数据技术无需人们手动采集信息,可通过计算机系统将数据类别细化,为政府经济政策的制定提供数据支持。
一、传统宏观经济预测在统计数据中存在的缺陷
在以往的数据统计中,传统宏观经济预测主要有以下缺陷:(1)经济预测存在滞后性,统计数据要在经济运行后由有关部分负责汇总,整个过程耗时很长,数据指标有时会滞后一个季度。(2)存在严重的统计误差。过去统计数据要依靠认为搜集汇总,人为参与度较大,汇总到的数据难以保证准确性,有时存在统计误差。(3)数据获取成本略高。数据收集过程复杂,需耗费大量人力与物力,所以数据获取成本很高。(4)样本量比较少。统计样本与获取宏观经济预测数据成本呈反比关系,统计样本量不断增加,相应的成本也会加大,所以有必要在统计样本与成本间找出平衡。比如CPI统计时找出平衡点,采用抽樣调查方式明确调查网点,遵循定人、定时、定点的原则,派人在网点采集价格,共涵盖8.3万家价格数据,但这与全国整体市场数量相比,样本量还不足整体的1%[1]。(5)颗粒度不够。相较于现有的宏观统计指标,主要是整体性宏观指标,仍以CPI指标为例,包括了八大类,分别为生活用品及服务、食品烟酒、教育文化和娱乐、衣着、医疗保健、交通和通信、居住以及其他用品和服务,同时,还包括262个基本分类的服务价格与商品,虽然较为丰富,但此类指标能够以为分类行业相关经济决策提供有效指导作用。总而言之,由于上述问题,宏观经济预测分析工作难以开展及时、有效的预测,这是当前传统宏观经济预测分析的主要缺陷。
二、大数据在宏观经济预测分析的应用优势及作用
(一)大数据在宏观经济预测分析的应用优势
宏观经济预测中应用大数据的技术优势如下:(1)大数据具有及时性。依靠互联网平台积累的数据会被存储于网络空间内,交易到的数据与价格等信息会在交易时,在网络内留下痕迹,大数据可提取相关痕迹用于分析问题,所以大数据用于宏观经济预测中是不会存在时间滞后性的。(2)大数据具有精准性。网络平台所提供的数据会在事件发生时做好记录,避免人才操作,可为后续数据分析提供原始数据,所以数据预测结果更准确。(3)成本相对较低。网络大数据会在事件发生的一瞬间被记录下来,不需要人为搜集数据,可直接通过技术方法提取并整理数据,从而降低数据搜集成本。
(二)大数据在宏观经济预测分析的作用
1、提供数据支持
宏观经济预测分析涉及到极为庞大的数据量,涵盖众多专业内容和学术知识,相应的,影响宏观经济的因素也具有多样化特征,这意味着宏观经济预测分析具有极强专业性。在以往传统宏观经济预测分析中,往往难以及时获取全面的内容数据,导致预测分析结果存在偏差,影响经济运行质量。但通过将大数据技术应用于宏观经济预测分析中,相关分析部门通过互联网技术能够实现宏观经济数据的快速采集,扩大宏观经济数据的收集范围,例如居民人均可支配收入和支出、全社会用电量、社会消费品总额等民生数据,极大的压缩了数据采集时间,甚至可以直接获取,为宏观经济预测分析效率的提高奠定良好基础。
2、增强宏观经济预测分析方法多元性
大数据技术的应用能够打破传统宏观经济预测分析模式,进一步提升分析能力。具体而言,传统宏观经济预测分析工作开展过程中,往往会受到财力、人力等因素的影响,且采用的调查形式为抽样调查,在对整体经济进行宏观层面的分析时,同样建立在抽样数据的基础上。但是,该方法缺乏普遍性,得到的宏观经济预测分析结果相对于社会真是水平,极易存在误差,预测结果的可利用度难以保障。但大数据的应用提高了宏观经济预测分析的便利程度,相关预测分析人员通过使用大数据分析技术,能够直接使用计算机分析海量数据,不必进行抽样调查,这样一来,分析方法转变为总体分析,分析结果也具有全面性和普遍性,甚至有效提升宏观经济数据预测和分析结果的可靠性和准确性,为后续经济工作的展开奠定良好基础。
3、提升宏观经济预测分析技术
基于大数据技术的宏观经济预测分析工作主要是依托于大数据系统和计算机,通过二者的有机结合优化预测分析技术。在实际预测分析过程中,会引入更多科学的分析模型,由于此类模型无法应用于传统宏观经济预测分析模式中,所以,大数据技术的应用还能够提升该预测分析的技术水平,一方面对上一阶段经济运行成果进行总结,另一方面对下一阶段经济运行目标进行展望,并根据异常的经济运行数据挖掘不良症候,并对其进行监测与分析,实现对经济运行风险的有效、及时规避。除此之外,图像识别技术和语音识别等新技术的应用能够减轻预测分析工作人员的压力,减少其工作量,释放人力资源,使其能够集中精力开展经济数据的深度分析工作,实现宏观经济预测分析质量和效率的提高。
三、大数据在宏观经济预测分析中的实践应用
(一)数据来源
可用来进行宏观经济预测分析的大数据来源较多,共有以下几种:(1)政务经济数据。即政府、工商、公安、税务等职能部门在履职中产生的业务数据资源,数据量庞大且数据内容复杂,所有数据被分散存储,目前政府在政务数据资源方面致力于归集共享,打破数据横向交互障碍,为政府大数据在各部门的高效共享奠定基础。(2)互联网企业在经营中积累的数据资源,比如阿里巴巴、百度、腾讯在社交、电商等领域内建立的资源库。或者移动、联通通信公司掌握大规模位置信息,这些数据不仅内容完备,且质量很高,但因涉及到隐私问题,企业不会将数据公开。(3)依靠搜索引擎提供的数据,这些数据可反映用户行为,比如百度利用自身的引擎为用户提供词条搜索数据服务,人们通过该方式得到的数据成本低,且快捷便利,但信息来源单一,无法得到定制化数据资源。(4)应用爬虫技术获得文本信息,通过爬虫脚本爬取互联网文本内容,但该方法技术难度较大,成本较高。(5)物联网数据,常见的有手机、探头等传感器数据,主要针对温湿度、速度、位置等数据的采集处理。 (二)数据获取
多数互联网数据与政府职能部门业务数据最初都是非结构化数据,这种原始形态的数据如果用来进行宏观经济预测,就会遇到数据来源不同的问题。不仅如此,以往传统的计量模型和统计模型所使用的数据主要是一些通过调研和统计工作得到的数据,而且直接用于处理和分析,是一种结构化数据信息。但是,大量经济信息数据往往异常在网络中,需要将其进行精准提取。因此,需要在数据挖掘中寻找隐藏信息,由于数据挖掘对象是网络数据集,数据集多数为文档形式,具有异质性与分散性特征,比如服务器内保存的日志文件或用户行为留下的信息等。应用情感分析、主题模型等自然语言分析方法可以从非结构化数据中获得有效信息,数据挖掘的一般过程主要包含搜索算法和建模技术,应用爬虫算法抓取互联网中的原始数据,再经过试探性分析清晰数据,将无用噪声过滤,保存有利于宏观经济预测的数据内容,或是使用百度指数获取数据等。
(三)处理维度灾难,消除数据噪声
大数据自身信息量大,价值密度比较低,在应用大数据技术挖掘信息时会面对不同维度或领域的信息。由于需要进行数据分析的变量增加,导致宏观经济预测过程会面临高维数据问题,甚至存在维数灾难。面对这类问题,可以通过降低变量维度,采用提取与筛选的方法将筛选出的特征代替原本特征集。数据噪声就是指对没有研究价值的数据信息进行处理,由于大量噪声数据的存在,数据处理过程延长,造成会加大数据分析成本,提升数据处理难度。若是没有精准识别出噪声数据,那么在宏观经济预测分析过程中会加入大量无价值的数据信息,也就是说,噪声数据造成的存在会给研究结果带来误差,导致预测分析结论无价值,想要消除数据噪声,可以应用SSA技术将原始数据处理为结构化数据。
(四)转变研究问题范式
过去的宏观经济检测模型主要是对解释变量与被解释变量做出假设,分析二者函数关系。大数据的数据获取渠道不同,不能确定宏观经济指标的假定函数关系,经济变量与解释变量只是存在一定的關联,所以传统计量模型无法将大数据采集的数据做出科学处理。依靠大数据“机器学习”技术,针对宏观经济变量和解释变量的关系重新解释,寻求相对应的变量匹配关系。计算机可以找出最佳匹配关系,随着计算次数的增加,通过大数据“学习”来提升数据挖掘与处理的有效性。常见的机器学习算法有遗传算法和人工神经网络等。
(五)建立景气预警监测系统
引入土地市场内企业招聘、工业废气排放、项目投资监管等非统计数据,对所有数据进行筛选,统一指标,将指标集合作为景气指数初选指标,每个指标都能代表经济活动中的某个领域,综合指标能够代表经济活动重要内容。整理数据指标,统一口径并补充缺失值,计算当月同比指数。采用K-L信息量,在时差相关分析法的作用对指标分类处理,按照指标性质合成景气指数。选择NBER合成指数或其他加权合成方法确定合成指数,应用打分法确定预警指数,对不同历史数据实际落点的指标使用分位数方法,科学计算不同状态下数据的临界值,即对指标赋予分值,再由不同指标分值计算综合分,最后对其作出评价,检验景气指数。
(六)搭建数据分析平台
拓宽数据采集渠道,整合政府核心业务数据,综合互联网社会经济数据资源,完成对海量数据的汇集处理,建立经济监测预警平台,实现经济预测、监测预警、数据分析等功能为一体的宏观经济预测与决策平台。加强计算机算法人员和经济分析人员相互协调工作,在明确宏观经济分析特点,掌握宏观经济发展需求的基础上完善大数据采集平台,为接下来的宏观经济预测营造大数据应用环境。鼓励社会经济工作者树立大数据思维,学会应用“大数据+”的思维方式解决问题,提升深度学习能力,为数据资源的高效开发与利用奠定基础。
四、总结
总而言之,虽然大数据已经应用于社会宏观经济预测分析中,但大数据在使用中难免会遇到各方面问题。目前人们主要应用来自百度和谷歌提供的数据,虽然在应用中无需耗费人力物力,但难免也会存在数据单一的现象。因此,有必要在大数据基础上建立宏观经济预测系统,及时处理维度灾难,消除数据噪声,转变研究问题范式。
参考文献:
[1]高艳.大数据在宏观经济预测分析中的应用[J].经济管理文摘,2020(14):175-176.
[2]马红燕.大数据视角下的宏观经济预测[J].中阿科技论坛(中英阿文),2020(07):39-42.
[3]王建冬.大数据在经济监测预测研究中的应用进展[J].数据分析与知识发现,2020,4(01):12-25.
关键词:大数据;宏观经济;预测分析;数据获取
实际上,宏观经济预测中包含的内容十分广泛,大数据技术可以为政府提供多层次经济预测信息,同时对信息综合处理和加工。我国提出了将大数据、云计算用于数据分析的要求,促使宏观经济信息可以及时反馈给各个部门,加强各部门高效联动。大数据技术无需人们手动采集信息,可通过计算机系统将数据类别细化,为政府经济政策的制定提供数据支持。
一、传统宏观经济预测在统计数据中存在的缺陷
在以往的数据统计中,传统宏观经济预测主要有以下缺陷:(1)经济预测存在滞后性,统计数据要在经济运行后由有关部分负责汇总,整个过程耗时很长,数据指标有时会滞后一个季度。(2)存在严重的统计误差。过去统计数据要依靠认为搜集汇总,人为参与度较大,汇总到的数据难以保证准确性,有时存在统计误差。(3)数据获取成本略高。数据收集过程复杂,需耗费大量人力与物力,所以数据获取成本很高。(4)样本量比较少。统计样本与获取宏观经济预测数据成本呈反比关系,统计样本量不断增加,相应的成本也会加大,所以有必要在统计样本与成本间找出平衡。比如CPI统计时找出平衡点,采用抽樣调查方式明确调查网点,遵循定人、定时、定点的原则,派人在网点采集价格,共涵盖8.3万家价格数据,但这与全国整体市场数量相比,样本量还不足整体的1%[1]。(5)颗粒度不够。相较于现有的宏观统计指标,主要是整体性宏观指标,仍以CPI指标为例,包括了八大类,分别为生活用品及服务、食品烟酒、教育文化和娱乐、衣着、医疗保健、交通和通信、居住以及其他用品和服务,同时,还包括262个基本分类的服务价格与商品,虽然较为丰富,但此类指标能够以为分类行业相关经济决策提供有效指导作用。总而言之,由于上述问题,宏观经济预测分析工作难以开展及时、有效的预测,这是当前传统宏观经济预测分析的主要缺陷。
二、大数据在宏观经济预测分析的应用优势及作用
(一)大数据在宏观经济预测分析的应用优势
宏观经济预测中应用大数据的技术优势如下:(1)大数据具有及时性。依靠互联网平台积累的数据会被存储于网络空间内,交易到的数据与价格等信息会在交易时,在网络内留下痕迹,大数据可提取相关痕迹用于分析问题,所以大数据用于宏观经济预测中是不会存在时间滞后性的。(2)大数据具有精准性。网络平台所提供的数据会在事件发生时做好记录,避免人才操作,可为后续数据分析提供原始数据,所以数据预测结果更准确。(3)成本相对较低。网络大数据会在事件发生的一瞬间被记录下来,不需要人为搜集数据,可直接通过技术方法提取并整理数据,从而降低数据搜集成本。
(二)大数据在宏观经济预测分析的作用
1、提供数据支持
宏观经济预测分析涉及到极为庞大的数据量,涵盖众多专业内容和学术知识,相应的,影响宏观经济的因素也具有多样化特征,这意味着宏观经济预测分析具有极强专业性。在以往传统宏观经济预测分析中,往往难以及时获取全面的内容数据,导致预测分析结果存在偏差,影响经济运行质量。但通过将大数据技术应用于宏观经济预测分析中,相关分析部门通过互联网技术能够实现宏观经济数据的快速采集,扩大宏观经济数据的收集范围,例如居民人均可支配收入和支出、全社会用电量、社会消费品总额等民生数据,极大的压缩了数据采集时间,甚至可以直接获取,为宏观经济预测分析效率的提高奠定良好基础。
2、增强宏观经济预测分析方法多元性
大数据技术的应用能够打破传统宏观经济预测分析模式,进一步提升分析能力。具体而言,传统宏观经济预测分析工作开展过程中,往往会受到财力、人力等因素的影响,且采用的调查形式为抽样调查,在对整体经济进行宏观层面的分析时,同样建立在抽样数据的基础上。但是,该方法缺乏普遍性,得到的宏观经济预测分析结果相对于社会真是水平,极易存在误差,预测结果的可利用度难以保障。但大数据的应用提高了宏观经济预测分析的便利程度,相关预测分析人员通过使用大数据分析技术,能够直接使用计算机分析海量数据,不必进行抽样调查,这样一来,分析方法转变为总体分析,分析结果也具有全面性和普遍性,甚至有效提升宏观经济数据预测和分析结果的可靠性和准确性,为后续经济工作的展开奠定良好基础。
3、提升宏观经济预测分析技术
基于大数据技术的宏观经济预测分析工作主要是依托于大数据系统和计算机,通过二者的有机结合优化预测分析技术。在实际预测分析过程中,会引入更多科学的分析模型,由于此类模型无法应用于传统宏观经济预测分析模式中,所以,大数据技术的应用还能够提升该预测分析的技术水平,一方面对上一阶段经济运行成果进行总结,另一方面对下一阶段经济运行目标进行展望,并根据异常的经济运行数据挖掘不良症候,并对其进行监测与分析,实现对经济运行风险的有效、及时规避。除此之外,图像识别技术和语音识别等新技术的应用能够减轻预测分析工作人员的压力,减少其工作量,释放人力资源,使其能够集中精力开展经济数据的深度分析工作,实现宏观经济预测分析质量和效率的提高。
三、大数据在宏观经济预测分析中的实践应用
(一)数据来源
可用来进行宏观经济预测分析的大数据来源较多,共有以下几种:(1)政务经济数据。即政府、工商、公安、税务等职能部门在履职中产生的业务数据资源,数据量庞大且数据内容复杂,所有数据被分散存储,目前政府在政务数据资源方面致力于归集共享,打破数据横向交互障碍,为政府大数据在各部门的高效共享奠定基础。(2)互联网企业在经营中积累的数据资源,比如阿里巴巴、百度、腾讯在社交、电商等领域内建立的资源库。或者移动、联通通信公司掌握大规模位置信息,这些数据不仅内容完备,且质量很高,但因涉及到隐私问题,企业不会将数据公开。(3)依靠搜索引擎提供的数据,这些数据可反映用户行为,比如百度利用自身的引擎为用户提供词条搜索数据服务,人们通过该方式得到的数据成本低,且快捷便利,但信息来源单一,无法得到定制化数据资源。(4)应用爬虫技术获得文本信息,通过爬虫脚本爬取互联网文本内容,但该方法技术难度较大,成本较高。(5)物联网数据,常见的有手机、探头等传感器数据,主要针对温湿度、速度、位置等数据的采集处理。 (二)数据获取
多数互联网数据与政府职能部门业务数据最初都是非结构化数据,这种原始形态的数据如果用来进行宏观经济预测,就会遇到数据来源不同的问题。不仅如此,以往传统的计量模型和统计模型所使用的数据主要是一些通过调研和统计工作得到的数据,而且直接用于处理和分析,是一种结构化数据信息。但是,大量经济信息数据往往异常在网络中,需要将其进行精准提取。因此,需要在数据挖掘中寻找隐藏信息,由于数据挖掘对象是网络数据集,数据集多数为文档形式,具有异质性与分散性特征,比如服务器内保存的日志文件或用户行为留下的信息等。应用情感分析、主题模型等自然语言分析方法可以从非结构化数据中获得有效信息,数据挖掘的一般过程主要包含搜索算法和建模技术,应用爬虫算法抓取互联网中的原始数据,再经过试探性分析清晰数据,将无用噪声过滤,保存有利于宏观经济预测的数据内容,或是使用百度指数获取数据等。
(三)处理维度灾难,消除数据噪声
大数据自身信息量大,价值密度比较低,在应用大数据技术挖掘信息时会面对不同维度或领域的信息。由于需要进行数据分析的变量增加,导致宏观经济预测过程会面临高维数据问题,甚至存在维数灾难。面对这类问题,可以通过降低变量维度,采用提取与筛选的方法将筛选出的特征代替原本特征集。数据噪声就是指对没有研究价值的数据信息进行处理,由于大量噪声数据的存在,数据处理过程延长,造成会加大数据分析成本,提升数据处理难度。若是没有精准识别出噪声数据,那么在宏观经济预测分析过程中会加入大量无价值的数据信息,也就是说,噪声数据造成的存在会给研究结果带来误差,导致预测分析结论无价值,想要消除数据噪声,可以应用SSA技术将原始数据处理为结构化数据。
(四)转变研究问题范式
过去的宏观经济检测模型主要是对解释变量与被解释变量做出假设,分析二者函数关系。大数据的数据获取渠道不同,不能确定宏观经济指标的假定函数关系,经济变量与解释变量只是存在一定的關联,所以传统计量模型无法将大数据采集的数据做出科学处理。依靠大数据“机器学习”技术,针对宏观经济变量和解释变量的关系重新解释,寻求相对应的变量匹配关系。计算机可以找出最佳匹配关系,随着计算次数的增加,通过大数据“学习”来提升数据挖掘与处理的有效性。常见的机器学习算法有遗传算法和人工神经网络等。
(五)建立景气预警监测系统
引入土地市场内企业招聘、工业废气排放、项目投资监管等非统计数据,对所有数据进行筛选,统一指标,将指标集合作为景气指数初选指标,每个指标都能代表经济活动中的某个领域,综合指标能够代表经济活动重要内容。整理数据指标,统一口径并补充缺失值,计算当月同比指数。采用K-L信息量,在时差相关分析法的作用对指标分类处理,按照指标性质合成景气指数。选择NBER合成指数或其他加权合成方法确定合成指数,应用打分法确定预警指数,对不同历史数据实际落点的指标使用分位数方法,科学计算不同状态下数据的临界值,即对指标赋予分值,再由不同指标分值计算综合分,最后对其作出评价,检验景气指数。
(六)搭建数据分析平台
拓宽数据采集渠道,整合政府核心业务数据,综合互联网社会经济数据资源,完成对海量数据的汇集处理,建立经济监测预警平台,实现经济预测、监测预警、数据分析等功能为一体的宏观经济预测与决策平台。加强计算机算法人员和经济分析人员相互协调工作,在明确宏观经济分析特点,掌握宏观经济发展需求的基础上完善大数据采集平台,为接下来的宏观经济预测营造大数据应用环境。鼓励社会经济工作者树立大数据思维,学会应用“大数据+”的思维方式解决问题,提升深度学习能力,为数据资源的高效开发与利用奠定基础。
四、总结
总而言之,虽然大数据已经应用于社会宏观经济预测分析中,但大数据在使用中难免会遇到各方面问题。目前人们主要应用来自百度和谷歌提供的数据,虽然在应用中无需耗费人力物力,但难免也会存在数据单一的现象。因此,有必要在大数据基础上建立宏观经济预测系统,及时处理维度灾难,消除数据噪声,转变研究问题范式。
参考文献:
[1]高艳.大数据在宏观经济预测分析中的应用[J].经济管理文摘,2020(14):175-176.
[2]马红燕.大数据视角下的宏观经济预测[J].中阿科技论坛(中英阿文),2020(07):39-42.
[3]王建冬.大数据在经济监测预测研究中的应用进展[J].数据分析与知识发现,2020,4(01):12-25.