论文部分内容阅读
目前,我国以及国际上的学者在税收及数据挖掘领域方面的已有很多研究,数据挖掘在税收领域方面应用也日渐广泛。零散税收是日常税收的一部分,一般是指个体或者集体的临时性经营,包括个人提供的劳务等带来的税收收入等。零散税源单笔税收较小的特点,使得其在过往的研究中并未得到重视,数据挖掘各类分析方法零散税收方面的应用研究也十分少。但是,零散户户管数量大,一般占税务局户管数的百分之八十以上,且存在分布广、规范性差的特点,需要耗费大量的人力物力来加强征管,因此切实发挥信息化优势作用、科学利用历史数据发现知识和规律,提高零散税收的征管效率意义重大。数据挖掘是一种知识被发现的应用方面技术,是从不完善的、相对模糊的、有干扰的、海量的、随机的原始数据里,抽取实现并不知道、隐藏在内的、但具有可信性、有效的内容和信息的过程。预测型知识的挖掘指的是根据不同的数据源系统中或外来数据源中的已有数据,主要是历史数据,运用一定的数据挖掘方法从中发现数据规律并由此预测数据趋势的过程,其目的在于根据已有数据的特征、趋势挖掘判断下一阶段数据的走向。本文的研究目的是利用数据挖掘方法建立较好的零散税收预测模型。文章在对零散税收、数据挖掘相关理论研究的基础上,从零散税收的流程、征管特点出发,分析了零散税收与一般税收的不同之处,构建了能够支撑税收预测分析的零散税收分析指标体系。在指标体系的基础上,对零散税收预测建模拟采用的两种分析方法进行研究比较,进一步提出了税收预测模型建立的一般步骤。最后,根据H局的数据和信息,对预测模型进行了实际运用。主要创新点:1、将数据挖掘技术运用在零散税收的预测分析中,并构建了零散税收分析预测指标体系。国内暂时没有将数据挖掘技术应用在零散税收中的研究,本文在一般税收分析体系的基础上,根据零散税收的经营、征管以及会计核算特点,建立了对零散税收针对性较强的预测指标体系。2、将零散税收中的个体税收与自然人税收分开建模。指出了个体户税收与自然人税收业务、数据特点与不同,根据各自的特征选择最合适的模型,然后进行组合,得到了较好的零散税收预测模型。