论文部分内容阅读
纳税评估是税务机关在税收征管工作中,根据纳税人报送的纳税申报资料(包括企业所得税申报表、企业所得税申报附表、资产负债表、损益表等),财务资料和日常掌握的征管资料及相关行业其他信息资料,采用综合而有效的分析方法,对纳税人的纳税情况进行审核分析,依据国家的有关法律政策,对纳税人的纳税情况的合法性、真实性、准确性进行评定处理的管理工作[1]。它涉及到纳税人全部涉税信息,数据量十分庞大,需要海量数据存储与运算能力的信息系统支持。传统数据库技术已经不能满足需求,而数据仓库技术可以将各种格式不同、来源不同的数据整合,并能为用户提供决策分析。因此,以数据仓库技术建立纳税评估系统,并在此基础上应用数据挖掘技术解决纳税评估当前面临的问题,是本文研究的重点。数据挖掘(Data Mining,MD)是从大量数据中发现潜在规律、提取有用知识的方法和技术。近年来,数据挖掘受到了国内外的普遍关注,己经成为信息系统和计算机科学领域研究中最活跃的前沿领域。数据挖掘已广泛应用于生物医学、金融、零售业、电信业等领域,并产生了巨大的效益。其中孤立点检测是数据挖掘技术研究的一个重要方向。本文研究了如何在纳税评估中应用孤立点检测技术,并根据本县税源特点,设计并实现了孤立点检测算法,将数据挖掘技术真正应用到了税收工作中,在本省的税收系统中尚属首次。纳税评估规则集是对税收政策的归纳和纳税评估实际经验的总结,本文研究了通过计算机程序对规则集进行处理的可行性,并提出了可优化的规则集处理方法。本方法首先根据业务规则建立规则集,然后把这些规则集应用到对纳税评估数据的判断中,最后通过和纳税评估结果比较,验证规则集的准确性,从而不断优化规则集,最终提高规则集的准确度。本文结合了计算机技术与纳税评估知识,将计算机技术有效地应用在税收业务中,详细描述了纳税评估系统的设计和实现过程。对系统中ODS、数据仓库、持久层、逻辑层、展示层所使用的技术和原理作了介绍。并阐述了建立数据仓库、建立指标模型、处理空缺值、规范化数据、初始化规则集、孤立点检测算法、纳税评估流程等关键技术的具体实现方式。最后,本文对纳税评估系统的运行情况进行了统计分析,分析表明本文的基于规则集和孤立点检测的纳税评估系统的可用性和稳定性。