论文部分内容阅读
摘要:可持续发展是一种注重长远发展的经济增长模式,最初于1972年提出,指既满足当代人的需求,又不损害后代人满足其需求的发展,是科学发展观的基本要求之一。可持续发展对于一个国家或地区来说十分重要,本文通过方差判别发展是否均衡,挑选发展均衡的地区进行聚类,然后用格拉布斯准则剔除极小值的方法得到了发展较好且均衡的地区,这是地区判定是否符合可持续发展的两个重要因素,通过这两个重要因素确定出地区是否可持续发展。
关键词:可持续发展;格拉布斯准则;方差;Q型聚类
为清晰的定义一个国家是何时,如何可持续和不可持续的。经分析每个年代对于可持续发展水平的要求是不同的,例如以古代封建统治下的标准是不可以定义现代可持续发展水平。第一次工业革命初期人们没有可持续发展的意识,不注重这方面的要求。这个评价标准会受科技,文明进步而发生改变。为解决这个问题本文以所需评价的时段,各地区的不同指标数据为基础进行计算。为满足协调发展这里采用方差表现各国五个指标是否协调,以方差计算值作为指标将抽取出来的30个国家进行分类,比较两组类别之间的差别,并將差别表现为方差更小的国家挑选出来进行格拉布斯准则进行再次挑选。这么做是为了排除一些落后国家五个指标整体落后的情况,虽然它满足协调但是不满足发展。
可持续发展是指既满足当代人的需求,又不损害后代人满足需要的能力的发展。换句话说,是指经济、社会、资源和环境保护协调发展。可持续发展的三大特征为:1.可持续发展鼓励经济增长。2.可持续发展的标志是资源的永续利用和良好的生态环境。3.可持续发展的目标是谋求社会的全面进步。为准确评价一个地区或国家是否可持续发展,这里以可持续发展定义所关注的几个方面找寻了5个指标,经济上选择人均GDP,地区生产总值能够很好的体现一个地区经济发展水平的指标。能源使用方面选择可替代新能源和石油使用量,可替代新能源的人均占有量越高越好,石油使用量是越低越好。环境方面使用人均二氧化碳排放量,健康方面选择新生儿死亡率。对数据进行排名排序。
1.方差计算
为在协调性方面区别各个国家是否处于不偏重状态,这里利用排名方差值来进行区分。方差可以可以描述一组数据的离散度,这里方差越小说明该国家发展越协调,下式为方差计算公式:
将方差计算绘成下表,从表中方差值可以看出,有些发展、科技比较落后的国家的方差值也很小,在聚类分析中这些国家显然也会被分到发展比较协调的那一类。
例如早人口红利是一个发展比较滞后的国家,为防止这些国家的干扰,在聚类分析后本文进行了格拉布斯准测剔除极值,目的是将这些落后国家剔除,显然这些国家并不能满足可持续发展原则。
2.聚类分析
把30个国家所计算的方差作为聚类分析的指标进行分类,通过比较分类结果的特征差异来定义类别是否属于协调发展
1.数据标准化处理,使相差较大的指标变量量纲或数量级的数据能放到一起加以比较;
2.选择距离定义方式,采用聚类分析中用的最广泛的欧式距离,每个样本各自视为一类,计算样本之间的距离;
3.选择聚类方法,此处使用的是实际应用最多的谱系聚类,具体方法采用分类效果较好、应用较广的离差平方和法进行计算。
计算相关系数,度量这种分类的失真度,由分类确定的结构与数据的拟合程度。
C=0.8554,C接近于1分类效果较好。
下图为聚类结果图:
3.格拉布斯准则剔除极值
在上述过程中已经把发展不协调的国家排除,但协调发展的国家里存在着发展比较落后的国家,他们的所有指标排名均匀靠后。这些国家显然也不满足可持续发展原则。所以这里将分类结果中协调的那一类进行格拉布斯准测剔除极值最终定义出30个国家中可持续的国家有哪些。通过下列公式进行计算综合排名的G(i)。
xi表示这个国家综合排名,i表示整体国家综合排名的均值,s表示标准差。
经过一系列的计算,整理得到下表,用所得到的G(i)值与格拉布斯临界值检验表进行对比,将异常数据剔除。这组综合排名的格拉布斯临界值为1.492,其中有四个国家的G(i)>1.492。他们分别是哈萨克斯坦、早人口红利、阿拉伯埃及共和国、安哥拉。这四个国家对应的G(i)值如下表。
结论:
通过上述步骤,通过方差和聚类将发展不均衡的国家进行第一次筛选,利用格拉布斯准则对发展均衡但整体落后的地区进行第二次筛选,最终得到了可持续发展地区。本文通过二次筛选的方法对地区是否可持续发展进行判断,并得到了较好的结果。
关键词:可持续发展;格拉布斯准则;方差;Q型聚类
为清晰的定义一个国家是何时,如何可持续和不可持续的。经分析每个年代对于可持续发展水平的要求是不同的,例如以古代封建统治下的标准是不可以定义现代可持续发展水平。第一次工业革命初期人们没有可持续发展的意识,不注重这方面的要求。这个评价标准会受科技,文明进步而发生改变。为解决这个问题本文以所需评价的时段,各地区的不同指标数据为基础进行计算。为满足协调发展这里采用方差表现各国五个指标是否协调,以方差计算值作为指标将抽取出来的30个国家进行分类,比较两组类别之间的差别,并將差别表现为方差更小的国家挑选出来进行格拉布斯准则进行再次挑选。这么做是为了排除一些落后国家五个指标整体落后的情况,虽然它满足协调但是不满足发展。
可持续发展是指既满足当代人的需求,又不损害后代人满足需要的能力的发展。换句话说,是指经济、社会、资源和环境保护协调发展。可持续发展的三大特征为:1.可持续发展鼓励经济增长。2.可持续发展的标志是资源的永续利用和良好的生态环境。3.可持续发展的目标是谋求社会的全面进步。为准确评价一个地区或国家是否可持续发展,这里以可持续发展定义所关注的几个方面找寻了5个指标,经济上选择人均GDP,地区生产总值能够很好的体现一个地区经济发展水平的指标。能源使用方面选择可替代新能源和石油使用量,可替代新能源的人均占有量越高越好,石油使用量是越低越好。环境方面使用人均二氧化碳排放量,健康方面选择新生儿死亡率。对数据进行排名排序。
1.方差计算
为在协调性方面区别各个国家是否处于不偏重状态,这里利用排名方差值来进行区分。方差可以可以描述一组数据的离散度,这里方差越小说明该国家发展越协调,下式为方差计算公式:
将方差计算绘成下表,从表中方差值可以看出,有些发展、科技比较落后的国家的方差值也很小,在聚类分析中这些国家显然也会被分到发展比较协调的那一类。
例如早人口红利是一个发展比较滞后的国家,为防止这些国家的干扰,在聚类分析后本文进行了格拉布斯准测剔除极值,目的是将这些落后国家剔除,显然这些国家并不能满足可持续发展原则。
2.聚类分析
把30个国家所计算的方差作为聚类分析的指标进行分类,通过比较分类结果的特征差异来定义类别是否属于协调发展
1.数据标准化处理,使相差较大的指标变量量纲或数量级的数据能放到一起加以比较;
2.选择距离定义方式,采用聚类分析中用的最广泛的欧式距离,每个样本各自视为一类,计算样本之间的距离;
3.选择聚类方法,此处使用的是实际应用最多的谱系聚类,具体方法采用分类效果较好、应用较广的离差平方和法进行计算。
计算相关系数,度量这种分类的失真度,由分类确定的结构与数据的拟合程度。
C=0.8554,C接近于1分类效果较好。
下图为聚类结果图:
3.格拉布斯准则剔除极值
在上述过程中已经把发展不协调的国家排除,但协调发展的国家里存在着发展比较落后的国家,他们的所有指标排名均匀靠后。这些国家显然也不满足可持续发展原则。所以这里将分类结果中协调的那一类进行格拉布斯准测剔除极值最终定义出30个国家中可持续的国家有哪些。通过下列公式进行计算综合排名的G(i)。
xi表示这个国家综合排名,i表示整体国家综合排名的均值,s表示标准差。
经过一系列的计算,整理得到下表,用所得到的G(i)值与格拉布斯临界值检验表进行对比,将异常数据剔除。这组综合排名的格拉布斯临界值为1.492,其中有四个国家的G(i)>1.492。他们分别是哈萨克斯坦、早人口红利、阿拉伯埃及共和国、安哥拉。这四个国家对应的G(i)值如下表。
结论:
通过上述步骤,通过方差和聚类将发展不均衡的国家进行第一次筛选,利用格拉布斯准则对发展均衡但整体落后的地区进行第二次筛选,最终得到了可持续发展地区。本文通过二次筛选的方法对地区是否可持续发展进行判断,并得到了较好的结果。