论文部分内容阅读
在山东省国家税务局中,计算机技术和网络技术已经得到广泛的应用,实现了用计算机收集和处理数据,部分单位还实现了地域性的资源共享。但是随着计算机应用的不断深入,大量的数据产生于业务处理系统中,并且正在以成倍的速度增长,但由于许多业务应用系统大多自称体系,互相孤立,使用的硬件和软件平台、数据结构、数据标准也不尽相同,因此,大量产生的数据分布在不同的地方和不同的应用系统中,形成“信息孤岛”,从而不能实现数据的集中和共享,很难从全局的角度综合分析和利用数据。因此山东省国税分析预测工作还未能形成系统、科学的运作,仅限于通过计算机收集和整理数据,然后通过人工分析对国税的税收量进行简单预测。 数据仓库和数据挖掘技术的出现,为分析人员提供了强有力的信息支持,帮助分析人员进行正确的判断,做出科学的决策。本文就如何运用数据仓库和数据挖掘技术,改善目前国税分析预测的现状,提高分析预测的能力和效率进行了研究:针对国税分析预测的特点和要求,就如何建立面向国税分析预测的数据仓库以及在此基础之上数据挖掘技术的应用进行了研究,并对适用于国税分析预测的数据挖掘算法进行了探讨。设计了包括面向国税分析预测数据仓库的规划分析、设计实施和使用维护,基于国税分析预测的数据挖掘方案,数据挖掘算法模型研究等一整套基于数据仓库技术和数据挖掘技术的国税分析预测解决方案。 本文第一章简要的概述了山东省国税局的数据应用情况,并根据实际应用提出了国税分析预测系统开发的背景。这一章中还介绍了系统开发中所用到的数据仓库技术和数据挖掘技术的基础知识,以及该课题研究的内容和意义;在第二章中通过对国外税务系统应用数据仓库的情况提出了符合山东省国税局的数据仓库的需求,并对面向国税的分析预测系统的数据仓库和数据挖掘的构建提出了解决方案;第三章详细讲解了面向国税分析预测的数据仓库设计,包括数据仓库的设计和实现;第四章详细讲解了面向国税分析预测的数据挖掘方案的研究,包括数据挖掘的目的、数据挖掘的构建以及对挖掘结果的解释和评估;第五章就第四章中提到的挖掘算法进行了详细讲解,并对适用于国税预测分析的数据挖掘算法模型进行了分析;第六章在前五章研究的基础上得出了国税分析预测系统建立的意义以及对外来本系统发展的展望。