论文部分内容阅读
数据的分组问题是统计学中的一个基本的课题,因其强烈的应用背景和问题的复杂性,现今仍然是热门的研究领域。本文通过中国各省的GDP数据,讨论了对中国进行经济区域划分的问题。经济区域是客观存在的,它不仅仅反映了区域的经济实力,也综合了该地区自然、社会发展等各方面的实力。通过经济区域划分,我们能够合理的组织地域分工、资金投放,极大的促进国民经济的持续和协调发展。 很多统计学家、经济学家注意到了经济区域划分的重要性。他们逐渐地把统计的方法引入区域划分问题中.厉以宁在文献[12]中详加阐述了聚类分析、主成分分析这两种方法,并给出了度量经济区域差异的方法。在文献[14]中作者给出了改进的聚类分析的方法:方差平方和聚类分析、加权变量影响的方差平方和法聚类分析、预先确定组数的拟和聚类分析。在他们给出的论述中,我们发现,他们并没有阐述经济区域的个数的来源,只是讨论了在事先确定经济区域个数的情况下,经济区域是如何划分的。 本文主要解决的是以中国各省的GDP数据为基础,在不事先确定组数的情况下,将我国大陆的行政区划分为不同的经济区域的问题。全文主要有三部分工作: 第一部分,介绍了AIC准则(Akaike Information Criterion)。自Akaike在1973年提出了AIC准则后,AIC准则已被人们应用于统计学的许多领域,在实际应用中得到了较好的结果。我们在这里简单给出AIC准则的推导过程,这是本文工作的主要理论基础. 第二部分,将AIC准则应用于数据分组,给出分组公式。受到AIC准则想法的启发,随后给出一个新的分组方法,定义为绝对方差准则。 第三部分,以中国各省GDP数据为基础,利用上述两种方法,给出分组结果,解决实际问题.