论文部分内容阅读
随着信息化技术的发展,各级税务部门可获得的税收征管数据容量越来越大,海量的税收征管数据背后隐藏许多重要信息。在传统的税收预测工作中,中小地税机构无法有效的集成各个“信息孤岛”,同时缺乏发现税收征管数据背后隐藏知识的手段,从而出现“数据爆炸而知识贫乏”现象。税收预测人员希望对海量的税收征管数据进行更深层次的分析,生成与税收预测相关性更大的税收征管数据,为税收预测和决策提供帮助。本论文就Visual Basic for Applications (VBA, Visual Basic的一种宏语言)结合数据挖掘技术在税收预测中的应用问题,在掌握和分析关于数据挖掘技术发展、传统税收预测技术的基础上,对税收征管数据挖掘过程模型建立、数据预处理技术、关联规则挖掘等问题进行研究,主要完成工作如下:1.中小地税机构税收预测系统的需求分析,结合税收征管数据处理流程和业务需求,提出了中小地税机构税收预测系统的设计框架;2.在了解税收征管数据存储和处理现状的基础上,针对税收征管数据中存在的问题和数据挖掘技术对数据的要求,总结了常见的数据预处理技术和适用情况;3.数据挖掘组件的设计,针对税收征管数据特点调用SQL Severe2000中的Microsoft决策树和Microsoft聚集方法进行数据挖掘;4.税收预测组件的设计,针对税收预测人员习惯,采用VBA方式在在EXCEL2003中实现基于时间数列、基于税收与经济关系的预测方法;5.其它相关组件的设计。该系统主要功能经税收预测人员试用,使用效果良好。这些预测结果可以帮助税收预测人员做进一步预测,从而提高税收预测的准确性,使低层次的简单查询、统计税收征管数据应用提升到知识挖掘和决策支持的高级应用。