论文部分内容阅读
人口问题一直是全社会最为关心的问题,人口的迁移与流动及其影响因素与管理方法是相关部门的管理工作者最棘手的问题。在以往的人口问题的研究中,已经出现了大量的相关的数据,但是在人口管理中这些数据多被管理者直接用来查询或者统计,而这些大量的数据中所隐含的我们最需要的或者说对我们最有用的信息却没有被我们发现。但是数据挖掘这门技术正好能解决上述问题,因为数据挖掘是在海量的并且没有直接规律的,这个过程的主要目的就是从大量的数据中挖掘出对我们最有价值的信息,而数据挖掘中的聚类及关联规则的挖掘及其应用是数据挖掘领域中非常重要和有价值的部分。因此本文在有关章节先介绍了数据挖掘的基本相关概念,并且着重探讨了数据挖掘中聚类方法及关联规则挖掘及其挖掘算法及实现。在第一部分内容中首先主要讨论了文章的研究背景与现状,通过讨论总结发现目前关于人口变动的研究多是关于流动人口或是青少年、老年等特殊年龄段的人口,鉴于更实际的需要,本文选择了地区变动人口为对象,但流动人口的去向性的调查并不能反映我们所要求的‘地区’这个对象,因此我们以地区这个不变点为基础,以迁移人口及净迁移差额率这些数据本身为目标展开研究,确定了具体的研究对象。在第二部分中,作者首先采取了GIS技术,以数据本身说话,把各个地市的净迁移差额率与经济因素的关系在地图上直观反应出来,力争做到简单明了,同时为下一步的研究奠定基础。在第三部分中,承接第二部分的内容,有了研究对象数据的直观变现和对此提出的问题,接下来的讨论就是对四川省21个地市对象的数据进行聚类,并选择了典型的中心距离聚类算法,在实现算法的工具选择上,考虑到在这部分内容中,21个对象不算太多的数据,如果选择复杂的算法或是使用大型的实现工具,取得的结果可能反而会不理想,因此作者大胆选择了方便快捷的SPSS工具。在第四部分中,以第一部分四川省各个地市迁移人口的净迁移差额率的分布的特征和结论为依托,以第二部分内容中的聚类为新的研究元素,在该部分内容中,把四川省各个地市的经济与非经济因素数据引入,选择经典的AP迭代算法,并使用Oracle数据库语言实现,探讨了使21个地市分属不同类别的关联因素,并对结果做出简要分析,提出相应的人口管理政策。