论文部分内容阅读
[摘 要]随着信息技术的快速发展,我国已经进入大数据时代,人们的生活方式发生了较大的改变,在无形中增加了政府统计工作的难度。对此,政府人员更要加强大数据研究,将其与CPI统计工作结合起来,重视大数据对CPI的影响,及时解决存在的问题,以不断提高政府统计工作的质量。基于此,本文立足于CPI统计现状,重点分析了大数据对CPI统计的影响与改进方式。
[关键词]大数据;CPI统计;影响;改进方式
doi:10.3969/j.issn.1673 - 0194.2019.02.085
[中图分类号]C819 [文献标识码]A [文章编号]1673-0194(2019)02-0-02
1 我国CPI统计的实施现状
目前,我国针对城乡居民CPI指数进行调查统计时,主要涉及衣、食、住、行、医疗等8大领域,调查范围较广,主要面向全国各地的市场与消费单位,因此数据信息量十分庞大,为统计工作带来较大的挑战。在数据统计、计算的过程中,通常使用采样调查法,选择一些较为典型的商品或者市场,对所需调查的内容进行分析,从而获取结果,但这种方式很容易受到内外部因素的干扰产生误差,因此得出的结果也只能用于参考,不具备准确性。
2 大数据对CPI统计的影响
2.1 对传统统计模式的影响
现阶段,大数据已经受到社会各界的广泛关注,并且引领世界走向新时代。在大数据内涵方面,具有内容多样、容量巨大、流动快、稳定性差等特征。具体来说:一是与传统度量范围相比,大数据在数量上占据明显优势,其单位用TB、PB、EB表示,目前全球每两天便能够形成5 EB左右的数据量,也就是5×1018 B;二是数据类型多样,且较为复杂,不仅包括结构化,还包括半结构化、非结构化数据,且后两者所占比例逐渐增加。
2.2 对CPI数据采集的影响
现阶段,我国主要采用人工采价与抽样调查相结合的方式进行CPI统计,与纯手工数据采集相比,在效率与实时性方面有所提升,人为误差得到显著降低。国家统计局在各个地区设立了直属调查小组,分布在31个省市、500个调查市县的5万个商业业态、农贸市场、电影院、医院等提供服务消费的单位,每隔5天对猪肉、蔬菜、鞋帽等与居民生活息息相关物品的价格进行调查。但是仍然存在一些问题,如抽样调查难免出现误差、采价成本较高等,都会造成各类误差,导致计算得出的CPI数值与商品评价价格相比过高或者过低。在大数据快速发展的背景下,将其应用在CPI数据采集中,与传统少量数据抽样方式相比,所编制的规格、价格等方面均与总体十分贴近,不但能显著降低人为误差,还能够有效控制抽样误差,与传统方式相比,数据采集效率提高了3倍左右。由此可见,应用大数据有效提升了CPI数据的采集效率。
2.3 对CPI指数计算的影响
在大数据诞生以后,对CPI计算方面也产生了一定的影响,主要表现在样本范围与样本时间方面。
在样本时间方面,以往CPI编制中的数据采集时间往往是固定的,并且两个采集点之间的时间距离较长。事实上,商家与消费者都会根据价格调整购买方式,如若出现商品滞销,商家则会采用打折促销的方式,这时消费者的购买量往往会增加。这种固定时间采集的方式很可能导致商品价格指数过高或者过低,造成统计误差,而应用大数据能够实时获取商品的价格、数量,通过动态计算CPI指数的方式消除统计误差。
在样本范围方面,大数据的应用使采集到的样本与总体十分相似,在CPI计算中的样本范围也不再局限于8大领域,而是将所有居民消费的商品均纳入其中。2011年,阿里巴巴推出了网络零售价格指数,与淘宝四级类物品成交均价相同。2016年5月,网购商品物价水平变动指数同比上升0.05%,分类同比中食品类的涨幅最大,在短短一个月期间便增长了2.26%,主要受外用膳食品上漲的影响,阿里巴巴网络核心商品价值分类同比指数变化情况如图1所示。在本次调查过程中,虽然没有将全部淘宝物品均包含在统计范围中,但从调查结果可见,与传统CPI统计方式相比,样本的范围已经得到了明显扩大。
2.4 对CPI权重的影响
在CPI编制的过程中,权重是其中十分重要的环节之一,目前我国每隔5年便做一次大的调整,最近一次调整在2016年。从新的权重构成中可知,食品类权重比例降低,大约降低25%左右,而居住类权重比例显著提升,已经超过45%。事实上,由于我国目前正处于社会转型的关键时期,居民消费结构上产生了新的变化,权重更新也较为缓慢,对CPI数据统计质量产生较大的不利影响。而大数据应用以后,有效提高了我国的权重调整速度,同时还能将统计局对各类商品权重调整的结果向大众公布,为相关部门获取数据提供便利,进一步提高CPI权重调整的透明度,由此更加突显大数据对CPI权重产生的影响。
3 大数据背景下CPI统计方法的优化措施
3.1 实施现代化CPI数据采集
在大数据时代,为采集统计数据提供了充足的技术支持,使数据采集数量、范围均得到了有效拓展与延伸,使采集结果变得更加准确。例如,使用传统方式采集生活必需品时,只能选取几样具有代表性的数据,与实际相比有很大出入,统计结果的准确性不高。
3.2 创新CPI统计方法
在以往统计方式中,只能对固定数据进行计算,随着信息量的日渐增加,传统工作量增加,效率却逐渐降低,已经很难符合现代工作需求。在大数据技术的不断发展之下,可使用高级指数公式完成CPI统计。这种新型计算方式借助链式加权操作法,使用起来较为灵活多变,能够对替代品进行计算,体现出不同商品对居民消费产生的各类影响。因此,在理论上应抛弃传统固定权重方式,计算公式如下。
(1)
在式(1)中,Zit代表的使产品i在时间段t范围内的特征组合,根据上述公式,可以将t时间段内各个特征的影子价格βkt看成调整CPI质量的依据。例如,在对牛肉、猪肉、羊肉进行计算时,可以对样本进行加权替换,并与先前结构进行比较分析,根据数据反馈判断不同肉类产品对居民消费选择的影响,从而提升CPI统计结果的准确性。 3.3 优化CPI权重设计方法
事实证明,居民消费选择与收入水平之间存在较大关联,从而会对消费权重变化产生影响,进而得出不同的计算结果。例如,以往我国经济发展较慢,居民收入水平较低时,对食品类的购买比重较大,几乎达到70%左右。而随着居民物质生活水平不断提高,消费权重开始偏向娱乐、居住、交通等方面,已经占居民总消费比例的38%左右。
3.4 提升CPI统计质量
当得出CPI统计结果以后,还需要对其进行进一步验证,以此来保障其准确性,以往工作方式由于无法保障统计质量与时代需求不符。在大数据时代,CPI统计应采用乘法调整、特征价格法、加法调整等多种方式,并提升CPI统计价格。
4 结 语
在市场经济快速发展的背景下,人们的消费观念也随之发生改变,逐渐由食品类权重转变为娱乐、电子等方面。因此,在政府统计工作中,工作人员应积极引进大数据等先进信息技术,对统计模式、数据采集、计算、质量调整、权重等多个方面进行分析与改进,不断拓宽数据信息采集的范围与渠道,并创新统计方式,以不断提升CPI统计的质量与效率。
主要参考文献
[1]蔡苑葩.探究大数据对CPI统计的影响及方法改进思路[J].收藏与投资,2017(9).
[2]田涛,周薇薇.大数据背景下线上商品价格变动对CPI的影响[J].统计与决策,2017(13).
[3]陈梦根,胡雪梅.CPI質量调整及方法改进问题新探[J].统计与信息论坛,2016(7).
[4]徐映梅,高一铭.基于互联网大数据的CPI舆情指数构建与应用——以百度指数为例[J].数量经济技术经济研究,2017(1).
[5]田涛.电商发展对CPI的影响研究——基于大数据背景下线上线下价格波动的同步性分析[J].上海经济研究,2016(3).
[6]张苗苗.大数据背景下影响CPI的因素浅析——基于Bootstrap方法[J].市场论坛,2016(8).
[7]王薇, 胡晓丹.“大数据”在CPI调查中的应用初探——人工采集网络购买商品价格的研究及建议[J].中国统计,2015(12).
[8]陈立双,王叶思丝.中国CPI编制方法在线上价格指数中的应用探讨[J].统计与决策,2018(7).
[关键词]大数据;CPI统计;影响;改进方式
doi:10.3969/j.issn.1673 - 0194.2019.02.085
[中图分类号]C819 [文献标识码]A [文章编号]1673-0194(2019)02-0-02
1 我国CPI统计的实施现状
目前,我国针对城乡居民CPI指数进行调查统计时,主要涉及衣、食、住、行、医疗等8大领域,调查范围较广,主要面向全国各地的市场与消费单位,因此数据信息量十分庞大,为统计工作带来较大的挑战。在数据统计、计算的过程中,通常使用采样调查法,选择一些较为典型的商品或者市场,对所需调查的内容进行分析,从而获取结果,但这种方式很容易受到内外部因素的干扰产生误差,因此得出的结果也只能用于参考,不具备准确性。
2 大数据对CPI统计的影响
2.1 对传统统计模式的影响
现阶段,大数据已经受到社会各界的广泛关注,并且引领世界走向新时代。在大数据内涵方面,具有内容多样、容量巨大、流动快、稳定性差等特征。具体来说:一是与传统度量范围相比,大数据在数量上占据明显优势,其单位用TB、PB、EB表示,目前全球每两天便能够形成5 EB左右的数据量,也就是5×1018 B;二是数据类型多样,且较为复杂,不仅包括结构化,还包括半结构化、非结构化数据,且后两者所占比例逐渐增加。
2.2 对CPI数据采集的影响
现阶段,我国主要采用人工采价与抽样调查相结合的方式进行CPI统计,与纯手工数据采集相比,在效率与实时性方面有所提升,人为误差得到显著降低。国家统计局在各个地区设立了直属调查小组,分布在31个省市、500个调查市县的5万个商业业态、农贸市场、电影院、医院等提供服务消费的单位,每隔5天对猪肉、蔬菜、鞋帽等与居民生活息息相关物品的价格进行调查。但是仍然存在一些问题,如抽样调查难免出现误差、采价成本较高等,都会造成各类误差,导致计算得出的CPI数值与商品评价价格相比过高或者过低。在大数据快速发展的背景下,将其应用在CPI数据采集中,与传统少量数据抽样方式相比,所编制的规格、价格等方面均与总体十分贴近,不但能显著降低人为误差,还能够有效控制抽样误差,与传统方式相比,数据采集效率提高了3倍左右。由此可见,应用大数据有效提升了CPI数据的采集效率。
2.3 对CPI指数计算的影响
在大数据诞生以后,对CPI计算方面也产生了一定的影响,主要表现在样本范围与样本时间方面。
在样本时间方面,以往CPI编制中的数据采集时间往往是固定的,并且两个采集点之间的时间距离较长。事实上,商家与消费者都会根据价格调整购买方式,如若出现商品滞销,商家则会采用打折促销的方式,这时消费者的购买量往往会增加。这种固定时间采集的方式很可能导致商品价格指数过高或者过低,造成统计误差,而应用大数据能够实时获取商品的价格、数量,通过动态计算CPI指数的方式消除统计误差。
在样本范围方面,大数据的应用使采集到的样本与总体十分相似,在CPI计算中的样本范围也不再局限于8大领域,而是将所有居民消费的商品均纳入其中。2011年,阿里巴巴推出了网络零售价格指数,与淘宝四级类物品成交均价相同。2016年5月,网购商品物价水平变动指数同比上升0.05%,分类同比中食品类的涨幅最大,在短短一个月期间便增长了2.26%,主要受外用膳食品上漲的影响,阿里巴巴网络核心商品价值分类同比指数变化情况如图1所示。在本次调查过程中,虽然没有将全部淘宝物品均包含在统计范围中,但从调查结果可见,与传统CPI统计方式相比,样本的范围已经得到了明显扩大。
2.4 对CPI权重的影响
在CPI编制的过程中,权重是其中十分重要的环节之一,目前我国每隔5年便做一次大的调整,最近一次调整在2016年。从新的权重构成中可知,食品类权重比例降低,大约降低25%左右,而居住类权重比例显著提升,已经超过45%。事实上,由于我国目前正处于社会转型的关键时期,居民消费结构上产生了新的变化,权重更新也较为缓慢,对CPI数据统计质量产生较大的不利影响。而大数据应用以后,有效提高了我国的权重调整速度,同时还能将统计局对各类商品权重调整的结果向大众公布,为相关部门获取数据提供便利,进一步提高CPI权重调整的透明度,由此更加突显大数据对CPI权重产生的影响。
3 大数据背景下CPI统计方法的优化措施
3.1 实施现代化CPI数据采集
在大数据时代,为采集统计数据提供了充足的技术支持,使数据采集数量、范围均得到了有效拓展与延伸,使采集结果变得更加准确。例如,使用传统方式采集生活必需品时,只能选取几样具有代表性的数据,与实际相比有很大出入,统计结果的准确性不高。
3.2 创新CPI统计方法
在以往统计方式中,只能对固定数据进行计算,随着信息量的日渐增加,传统工作量增加,效率却逐渐降低,已经很难符合现代工作需求。在大数据技术的不断发展之下,可使用高级指数公式完成CPI统计。这种新型计算方式借助链式加权操作法,使用起来较为灵活多变,能够对替代品进行计算,体现出不同商品对居民消费产生的各类影响。因此,在理论上应抛弃传统固定权重方式,计算公式如下。
(1)
在式(1)中,Zit代表的使产品i在时间段t范围内的特征组合,根据上述公式,可以将t时间段内各个特征的影子价格βkt看成调整CPI质量的依据。例如,在对牛肉、猪肉、羊肉进行计算时,可以对样本进行加权替换,并与先前结构进行比较分析,根据数据反馈判断不同肉类产品对居民消费选择的影响,从而提升CPI统计结果的准确性。 3.3 优化CPI权重设计方法
事实证明,居民消费选择与收入水平之间存在较大关联,从而会对消费权重变化产生影响,进而得出不同的计算结果。例如,以往我国经济发展较慢,居民收入水平较低时,对食品类的购买比重较大,几乎达到70%左右。而随着居民物质生活水平不断提高,消费权重开始偏向娱乐、居住、交通等方面,已经占居民总消费比例的38%左右。
3.4 提升CPI统计质量
当得出CPI统计结果以后,还需要对其进行进一步验证,以此来保障其准确性,以往工作方式由于无法保障统计质量与时代需求不符。在大数据时代,CPI统计应采用乘法调整、特征价格法、加法调整等多种方式,并提升CPI统计价格。
4 结 语
在市场经济快速发展的背景下,人们的消费观念也随之发生改变,逐渐由食品类权重转变为娱乐、电子等方面。因此,在政府统计工作中,工作人员应积极引进大数据等先进信息技术,对统计模式、数据采集、计算、质量调整、权重等多个方面进行分析与改进,不断拓宽数据信息采集的范围与渠道,并创新统计方式,以不断提升CPI统计的质量与效率。
主要参考文献
[1]蔡苑葩.探究大数据对CPI统计的影响及方法改进思路[J].收藏与投资,2017(9).
[2]田涛,周薇薇.大数据背景下线上商品价格变动对CPI的影响[J].统计与决策,2017(13).
[3]陈梦根,胡雪梅.CPI質量调整及方法改进问题新探[J].统计与信息论坛,2016(7).
[4]徐映梅,高一铭.基于互联网大数据的CPI舆情指数构建与应用——以百度指数为例[J].数量经济技术经济研究,2017(1).
[5]田涛.电商发展对CPI的影响研究——基于大数据背景下线上线下价格波动的同步性分析[J].上海经济研究,2016(3).
[6]张苗苗.大数据背景下影响CPI的因素浅析——基于Bootstrap方法[J].市场论坛,2016(8).
[7]王薇, 胡晓丹.“大数据”在CPI调查中的应用初探——人工采集网络购买商品价格的研究及建议[J].中国统计,2015(12).
[8]陈立双,王叶思丝.中国CPI编制方法在线上价格指数中的应用探讨[J].统计与决策,2018(7).