论文部分内容阅读
随着改革开放的深入和市场经济体制改革的不断完善,我国各个区域的济发展水平都有了显著提高。但由于各地区受到地理区位、经济政策、劳动力等因素的影响,不同区域的经济发展水平出现了显著的差异。1978年,辽宁省和山东省的GDP差距不大,但是到2012年,辽宁省GDP为2.48万亿元,而山东省GDP为5万亿元以上,远远超过辽宁省。为了研究辽宁省和山东省的经济差异,本文选取了两个省31个城市的GDP,外商投资总额,社会零售品消费总额等经济发展水平指标,通过聚类分析对比两个省各个城市的发展现状,并有针对性的对发展水平较低的辽宁省提出可行性政策建议。本文使用的数据是2002-2011年辽宁省和山东省31个城市的经济发展数据,文章的内容如下:第一章,序言部分。该部分主要介绍本文的研究背景,研究内容,研究意义,本文的创新点以及本文的不足之处。第二章,文献综述。介绍了城市经济发展水平的国内外研究现状,并加以分析。第三章,理论分析部分。第一部分是数据降维方法,该部分主要介绍了面板数据的处理方法。文中首先介绍了主成分分析相关理论,然后参考主成分分析中体现的数学降维的思想,对样本数据中每一个经济指标的时间序列进行降维处理,将三维的面板数据转化为二维数据,以便进行后续分析。第二部分是聚类分析相关理论,主要包括聚类分析的概述,概述部分包括聚类分析的定义、特征,以及聚类分析的典型步骤,然后详细描述并对比分析了聚类分析的两种常用方法:系统聚类方法和K均值聚类方法。其中,系统聚类方法中又具体介绍了最短距离法、最长距离法、重心法、中间距离法和离差平方和法这五种方法。第四章,实证分析部分。选取了辽宁省和山东省的31个地级市的15个指标进行分析,使用SPSS作为分析工具。实证分析共包括两个步骤,首先是数据的降维,在这一步中主要采用主成分分析计算因子得分的方法进行降维,将每一个指标的时间序列作为一个体系,得出每一个指标在时间序列上的得分;其次是对不同城市不同指标的聚类分析,这里构建了三个指标体系:经济总体状况指标体系、居民生活水平指标体系以及三次产业结构指标体系。对于每一个指标体系,文中选择了合适的方法进行聚类分析,分别得出两省31个城市的聚类结果,根据聚类结果得出分组,并对每一组进行定义和解释。第五章,政策建议部分。通过对第四章的分类结果进行解释,得出结论,并给出相应的政策建议,以改善辽宁省的经济发展状况。本章中提出的政策建议主要包括:以点带面,促进经济均衡发展;引导资源合理布局,加强城市基础建设;改革所有制经济,调整产业结构;利用区位优势,加强合作交流以及增加城镇居民收入。本文的主要创新点有以下四点:第一,广泛阅读面板数据降维和聚类分析相关的文献,对常用的聚类分析方法进行了深入研究和解释,并采用对比分析的方法详细论述了几种常用聚类方法的优缺点。第二,进行数据降维所选用的是时间维度,本文使用的数据是面板数据,在进行聚类分析之前需要进行数据的降维,与传统的降维方法不同的是,本文参考主成分分析的数学降维思想,以时间为变量,对面板数据中的各个指标单独进行降维处理,得到每个指标处理后的一个得分。第三,使用K均值聚类方法时,通过系统聚类结果来确定分组个数,得出分组数K的值,这在一定程度上可以提高K均值聚类算法的效率及聚类的准确度。未来关于聚类算法的研究中,面对大的数据集,在需要K均值聚类的时候可以考虑对数据进行抽样,然后用系统聚类方法得出分类数K的值,进而得到相对准确的聚类结果。第四,方法的创新,一般对于不同省份经济发展状况的分析,都是选取能够体现该省份经济发展水平的总体指标进行对比分析,本文采用的方法是对两省中所有城市的经济发展状况进行聚类分析,通过分析聚类结果中每一类中的城市数量等信息,得出结论,并提出一些改善城市经济发展状况的政策建议。在创新的同时,本文还有很多的不足之处,主要包括;第一,本文中使用的聚类分析方法都是现有的经常使用的方法,而这些聚类方法各有其局限性,需要在后续研究中加以改善。第二,指标的选取没有严格的标准,本文中指标的选取尽可能的遵循科学性、代表性、适用性、可比性、综合性以及可操作性原则,但由于数据本身的质量问题及统计标准的不同,选取的指标可能不太全面。第三,在聚类方法的选择方面,本文遵循的是几种方法聚类结果相同,则任选一种的原则,没有严格的标准,由此得出的聚类结果可能不是最优的分类。