基于主成分聚类分析模型对中国工业发展水平的研究

来源 :商 | 被引量 : 0次 | 上传用户:zhhs555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:随着中国经济的深入发展,工业作为第二产业,其发展水平是政府部门加强宏观调控和改善企业管理的重要基准。本文根据2013年《中国统计年鉴》[1]中的统计数据,选取规模以上工业企业的18个主要指标,建立31个省市工业发展水平的主成分聚类分析模型。
  首先用SPSS统计分析软件将原始数据进行标准化处理以排除量纲影响,利用SAS统计分析软件,将原始数据的18个指标进行主成分的提取,以在损失尽可能少的数据信息下达到降维的目的,本文选取了前两个主成分:工业水平综合成分以及工业企业经营水平成分。
  然后对主成分提取后的数据进行聚类分析,对31个省市进行聚类,根据各地区在工业水平上的差异将相似的地区聚为一类,剔除异常值后可将各省市分为三类,对聚类后的结果进行比较分析,从而了解中国各地区工业水平发展的优势和不足,最后得出中国工业各地区发展水平不均衡,同时整体水平较低的结论。
  关键词:工业企业;SPSS软件;SAS软件;主成分分析;聚类分析
  一、选题背景
  工业作为第二产业,在推动国民经济的持续高速发展过程中发挥了不可替代的作用。随着我国不断加快工业化进程,工业对国民经济增长的主导作用在长期内不会改变[2]。近年来,中国各地区工业的发展水平成为理论界和政府各部门等社会各界关注的焦点。未来的10年里,中国仍将处于快速工业化、快速城镇化和工业现代化快速推进的过程中。在这期间,工业经济的快速增长仍然是推动中国经济较快增长的重要力量;战略性新兴产业将逐渐成为推动工业发展的重要力量;传统产业在高新技术的改造下将全面升级,产品结构将不断提升,改造升级后的传统产业仍将会以较快速度增长[3]。
  二、数据来源、指标体系以及分析数据集
  考虑到工业发展水平问题的复杂性以及问题研究的时效性,本文以2013年《中国统计年鉴》中的数据为基础,就规模以上工业企业的18个主要指标进行研究,建立主成分聚类分析模型,力求对31个省市的工业发展水平进行尽可能合理的划分,从中把握中国工业的发展水平,希望能更好地为国民经济发展服务。
  在分析过程中,考虑到各指标单位的不同在分析过程中的影响,利用SPSS统计分析软件对原始数据进行标准化处理以排除量纲不同的影响,将标准化后的数据作为分析数据集导入SAS软件进行进一步的统计分析。在处理过程中可以发现数据中并不存在缺失值,可忽略这个问题。对于异常值可在问题的处理过程中进行具体的分析。
  三、主成分聚类分析
  (一)主成分分析[4]
  对31个省的数据从相关矩阵出发进行主成分分析,计算,x1,x2,…, x18的样本相关矩阵。根据的前三个特征值、特征向量以及贡献率得到前三个主成分分别为:
  1=0272x*1+0278x*2+0274x*3+0279x*4+0275x*5+0275x*6+0274x*7+0278x*8+0280x*9+0280x*10+0239x*11+0274x*12+ 0278x*13+0075x*14-0010x*15+0106x*16-0090x*17+0044x*18
  2=0007x*1+0004x*2+0018x*3-0009x*4+0008x*5-0024x*6-0009x*7+0042x*8+0018x*9+ 0018x*10-0016x*11+0047x*12+0005x*13-0092x*14-0670x*15-0201x*16+0388x*17+0587x*18
  3=-0040x*1-0111x*2-0145x*3-0012x*4-0018x*5-0136x*6-0147x*7-0080x*8+0011x*9+ 0006x*10+ 0181x*11+0067x*12+0025x*13+0683x*14-0107x*15+0612x*16+0086x*17+0141x*18
  其中,前两个和前三个主成分的累计贡献率分别达到799%和896%。
  第一主成分1在前13个变量上都有近似相等的正载荷,在x*14、x*16、x*18上有较小的正载荷,在x*15、x*17有较小的负载和,其中前13个变量是反映地区工业水平的核心指标,1越大,说明该地区工业综合水平越高,因此第一主成分可称为工业综合水平成分。
  第二主成分2在x*18(产品销售率:该指标反映工业产品已实现销售的程度,是分析工业产销衔接情况,研究工业产品满足社会需求的指标)有较大程度的正载和,在x*17(成本费用利润率:反映企业投入的生产成本及费用的经济效益,同时也反映企业降低成本所取得的经济效益)有中等程度的正载和,在x*15(资产负债率:该指标既反映企业经营风险的大小,也反映企业利用债权人提供的资金从事经营活动的能力)上有很高的负载荷,而在x*1、x*2、x*3、x*5、x*8、x*9、x*10、x*12、x*13有较小的正载荷,在x*4、x*6、x*7、x*11、x*14、x*16有很小的负载荷,可以认为这个主成分度量了该地区工业企业产品衔接及降低风险水平,2越大,表明该地区工业产品衔接水平越高且风险越低,可认为经营的越好,故第二主成分可称为工业企业经营水平成分。第三主成分难以给出明确的解释,故只取前面两个主成分。
  考虑到前两个主成分的累计贡献率已达到799%,接近80%,主成分分析提取的效果较好,故原来18个变量可以使用这两个主成分来表示,这样既达到了降维的目的,又能反映原始数据799%的数据信息。
  (二)聚类分析[4]
  下面,对由31个省市的工业企业指标数据提取出来的主成分数据进行Q型聚类分析。本文选用K均值法,直接利用SAS程序进行聚类分析,考虑到之前主成分分析已将数据标准化,故此处不需再做标准化处理,并简单分析后将初始聚类数设为五。   类均值之间的距离如下:
  ⅠⅡⅢⅣⅤ
  Ⅰ0000
  Ⅱ6.325 0.000
  Ⅲ2.983 7.373 0.000
  Ⅳ11.477 14.328 9.015 0.000
  Ⅴ6.857 10.250 5.189 5.536 0.000
  可以看出类与类之间有明显的距离存在,聚类达到了较好的效果。
  由于K均值法对异常值较敏感,从聚类得到的结果可以看到浙江和西藏自成一类,可以视为异常值点,说明这两个省的工业发展水平与其他省市相比存在一定的特殊性。剔除这两个异常值的影响,可将31个省市分为三个类:
  第Ⅰ类:北京、山西、广西、海南、重庆、贵州、云南、甘肃、青海、宁夏、新疆
  第Ⅱ类:天津、河北、内蒙古、辽宁、吉林、黑龙江、上海、安徽、福建、江西、河南、湖北、湖南、四川、陕西
  第Ⅲ类:江苏、山东、广东
  其中第Ⅰ类为工业发展水平较低的省市,第Ⅱ类为工业发展水平处于中等的省市,第Ⅲ类为工业发展水平较高的城市。
  四、结论
  (1)中国工业的整体发展仍处于较低的水平,工业企业发展现状十分严峻。提取工业综合水平成分和工业企业经营水平成分后,可以看到,除个别省市外,31个省市的大部分地区面临工业综合水平低的同时工业企业经营水平也低的现状,我国仍需要大力推动工业发展。
  (2)中国31个省市的工业发展出现明显的不均衡,通过对提取的主成分数据对31个省市进行聚类,剔除异常值可将各地区分为三类:
  第Ⅰ类:北京、山西、广西、海南、重庆、贵州、云南、甘肃、青海、宁夏、新疆
  第Ⅱ类:天津、河北、内蒙古、辽宁、吉林、黑龙江、上海、安徽、福建、江西、河南、湖北、湖南、四川、陕西
  第Ⅲ类:江苏、山东、广东
  其中第Ⅰ类为工业发展水平较低的省市,说明这部分地区的工业发展仍需要进一步的提高;第Ⅱ类为工业发展水平处于中等的城市,其中的上海、天津、辽宁是早期工业发展较快的城市,说明这一部分的省市目前的工业水平与早期的快速发展密切相关;而第Ⅲ类只有江苏、山东以及广东三个省,这三个省早期工业发展较快,同时后期工业也得到了良好的发展。可以发现中国工业发展十分的不均衡,国家仍需大力支持工业发展以带动国民经济发展,缩小我国与发达国家之间的差距。(作者单位:辽宁大学)
  参考文献:
  [1]中华人民共和国国家统计局.中国统计年鉴(2013)[M]. 中国统计出版社, 2013.
  [2]黄丽丽. 我国工业企业经济效益水平分析[D]. 中南大学, 2012年.
  [3]李平, 石碧华. 中国工业经济发展的前景[EB/OL]. [2014-6-23]. http://wenku.baidu.com/view/a7fe910916fc700abb68fcd5.html.
  [4]王学民. 应用多元分析[M]. 第三版. 上海财经大学出版社, 2009年:208-284.
其他文献
经济时代的大背景下,第三产业中的旅游业已成为推动经济发展的关键因素,更具发展潜力。旅游是居住在山地的少数民族发展经济的支柱,民族文化作为少数民族旅游发展的最重要支
摘 要:网络经济犯罪的案件时有发生,其对于人民的财产构成了严重的威胁,本文主要对网络经济犯罪问题及其防范策略进行了分析,并由此指出其对于社会的安定繁荣有着严重的影响,应加大对其的打击力度。文章主要对治理过程中存在的一些困难进行了分析,并对此提出了相应的预防管理方法,以期为案件的防范与侦破提供部分资料参考。  关键词:网络经济;经济犯罪;防范策略  一、引言  在网络应用范围越来越广泛的当今社会,网
2007年恰逢入世过渡期结束,上海经济发展进入了一个新时期.“十五”期间,上海经济发展总体表现出三大特色,速度快,质量高,能耗逐步降低,这为“十一五”期间经济新的腾飞打下
中国制造“成本优先”的模式正在受到挑战。随着市场环境的变化,企业正在被倒逼在能效方面做出改进。“不管是产品能效,还是企业自身的能效管理水平,企业都经受着考验和压力。” 德国莱茵T?V大中华区电子电气产品服务部技术支持与研发副总经理罗黎这样对记者说。  正如罗黎所言,作为领先的第三方检测认证机构,在产品能效和企业能效管理这两个领域,德国莱茵T?V(以下简称“T?V莱茵”)都致力于为企业提供一站式服务
期刊
一、案例:李某因经营酒店急需资金,向王某提出借款30万元,借期1年,王某同意出借但要求李某提供可靠的担保。李某遂找到他的朋友周某帮忙,周某同意用自有房屋作为借款的抵押。
近年来,中国制造迅速与全球经济接轨,中国供应商成为采购浪潮中的受益者,但在受益的同时也面临参与全球化竞争的风险。范江锋,作为法国必维国际检验集团检验认证部中国区总监,拥有着丰富的工业检验项目管理经验,看他支招“中国工业制造”多元化应对挑战。  产品质量是企业核心竞争力  :作为全世界的制造中心,中国的工业设施制造在全球供应链中扮演什么角色?  范江锋:在世界范围内,中国在供应链中扮演了一个重要的角
1 网络现状rn 软切换是CDMA的技术特点之一,同时CDMA系统也存在许多硬切换的场合.其中,载频之间的硬切换就是日渐引起运营商重视的问题之一.
笔者从寻衅滋事罪的现行困境入手,试图阐述寻衅滋事罪现行存在的价值和意义,重构其在刑法体系中的地位,同时从立法和司法两方面着手,探索对其困境的应对路径,以期能对寻衅滋