论文部分内容阅读
近年来,伴随住房货币化改革的推进,建设了大量的商品房、经济适用房,放开了二手房市场,使人民群众的住房条件得到了很大的改善,同时繁荣了我国住宅市场,使之成为国民经济一个有力的增长点。但在繁荣的背后,人们也发现了很多新的问题。 住宅建设前期的预测缺乏科学依据,造成土地和社会资源的浪费;经济适用房的审批不到位,审查把关不严,出现了开发商自行组织销售、高收入阶层进驻或投资、投机经济适用房、炒房号等现象,使有限的资源不能落实到应享受政策的家庭。直接导致满足中低收入家庭住房支付能力的低价房供应不足,房价上涨飞速,引发了新的社会矛盾。有悖于经济适用房建设的初衷;二手房交易中信息的不对称以及市场秩序混乱,导致欺诈行为屡屡发生等等。 由于我国国情的特殊性,决定了政府在住宅建设、房屋管理等方面必须发挥强有力的宏观监督和管理职能。因此,如何利用现代化的技术和手段,全面加快我国住房管理信息化进程,提高政府房管部门在管理审批等工作中的效率,并在此基础上对住房管理数据资源进行深度挖掘和应用,就成为摆在我国政府面前的紧迫任务和严峻课题。 数据仓库、数据挖掘技术以及联机在线分析处理是近年来兴起的新的技术热点。它们通过对数据的重新组织、智能分析,可以快速、准确地从大量数据中提取出有价值的信息,为管理决策所用,很好的解决了信息爆炸时代所引发的数据海量而知识饥渴的矛盾。将数据仓库和相关分析技术引入到住房管理中,可以更好地对相关信息开发利用、辅助政府进行日常管理以及制定发展计划和政策法规方面,具有重要的理论价值和现实意义。 本文站在政府房管决策部门的角度,以我国住房市场为研究对象,提出了通过使用数据仓库技术建立住房管理数据仓库,使用多维分析技术辅助日常管理活动,并运用关联规则挖掘技术进行房屋交易分析的解决方案,为我国住房管理信息化建设的发展进行探路。具体来说,本文主要完成了以下工作: (1)论述了本课题的研究背景、意义和应用价值,对国内外研究现状进行了分析,指出了本课题的研究对象方法和内容。 (2)基本概念和理论的研究。主要对数据仓库理论、联机分析处理技术和数据挖掘技术方面的基本概念、原理做了研究,并对三者之间的区别和联系做了讨论。 (3)住房管理数据仓库的分析和设计。在进行需求分析的基础上,实现了面向政府决策的、以交易分析为主题的住房管理数据仓库的规划和设计。包括:整体实施策略设计,体系结构设计,概念、逻辑、物理模型的设计,数据的抽取、转换、加载设计,元数据的设计等。 (4)对住房管理数据仓库多维数据集的实现和应用做了探讨和研究。首先借助MS SQL中的Analysis Server,给出了建立了住房管理多维数据集的方法和步骤。然后针对当前政府部门迫切需要解决的实际问题:经济适用房的资格审批和二手房交易中的合法性审查,提出了通过多维数据集进行分析的解决思路和步骤。 (5)对传统关联规则算法Apriori进行讨论,并针对其缺陷进行了改进分析。针对住房管理数据仓库中的数据特点,提出使用基于约束的、多维关联规则算法进行数据挖掘的方案,并建立了相应的挖掘模型,给出了算法描述的程序流程图。该算法模型引入了约束条件,并对频集搜索过程中,候选集生成过程中的项集连接步骤做了改进。 本论文在研究和撰写过程中,主要采用了理论与实践相结合的研究方法。首先通过查阅文献、实地调查等方法,进一步了解和捕获了政府房管部门的切身需求。使得在数据仓库建设主题上,能够更加符合现实要求。在整体结构上采用演绎的方法进行研究,将数据仓库和数据挖掘模型构建的一般原理应用到住房管理系统的具体实际之中。在数据仓库的整个设计过程中,还运用了系统分析和设计的方法,从需求到逻辑设计再到物理设计逐步展开。在具体设计过程中,使用了E-R图、星型模型等分析工具,并使用Visio完成了部分建模工作。 本文的主要创造性成果是:提出了面向政府决策的住房管理数据仓库建设的可行步骤和方法,并给出了具体的分析和设计模型;建立了基于住房管理数据仓库的多维数据集,并结合住房管理中的实际问题,给出了应用多维数集解决问题的思路和方法;对关联规则算法在频集搜索方面进行了改进尝试,提出了使用基于约束的多维关联规则挖掘算法对购房交易进行分析的方案,并建立了相应的挖掘模型。