论文部分内容阅读
税收是国家的经济命脉,是经济发展的重要杠杆,对税收数据进行有效的、合理的分析有重大而深远的意义。随着信息化进程的日益加速,数据仓库技术在税务系统中的使用更为普遍。通过构建税务数据仓库以及结合使用各种不同的分析处理技术,将历史数据变为有用信息,使微观税源监控、自然人管理和税收计划管理等变得更加有效和容易,同时也为税务系统的决策支持提供了保证。数据仓库项目的实施自底向上主要包括数据仓库的建模、抽取-转换-加载(ETL, Extract-Transform-Load)和对数据仓库中数据的展现。论文以数据仓库技术在南京地税综合信息系统中的实际应用为背景,对数据仓库的建模技术、ETL技术和数据仓库中数据的展现技术进行了探讨。首先,论文介绍了南京地税综合信息系统数据仓库所采用的体系结构,以及体系结构中各层次所选用的开发工具。其次,论文重点介绍了南京地税综合信息系统数据仓库的建模过程。这其中,对传统的数据仓库三阶段建模技术进行了一些改进,总结了在项目中应用的分层建模方法;在建立逻辑模型阶段,应用了维度建模的方法,并结合特定主题,介绍了项目中对不同类型的维度如何进行设计、对粒度如何进行选择以及对变化的维度如何进行处理等;在建立物理模型阶段,选取了数据仓库的存储策略以及索引策略等,构建了扩展性良好的、高性能的数据仓库。再次,使用ETL工具ODI (Oracle Data Integrator)实现了ETL过程并对其他关键技术的实现过程进行了介绍。最后,介绍了南京地税综合信息系统的实际应用,并对联机分析处理(OLAP,On-Line Analytical Processing)分析结果以及数据挖掘等的分析结果进行了丰富的图形化展示。在论文中应用的数据仓库建模技术、ETL技术等,同样适用于具有类似特点的其他省市税务系统,可以为其数据仓库的构建和应用提供一定的参考和实践借鉴。