应用数据挖掘技术进行税务分析

来源 :中国科技博览 | 被引量 : 0次 | 上传用户:yuhaolf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要]大数据时代的来临,信息数据越来越多,纳税人数量在快速地增加,税源呈现多元化、复杂化的特征,税源分布的领域越来越广,税源的结构越来越复杂,税源的流动性和隐蔽性越来越强。税务人员需要以更新、更便捷、更有效的方法,对大量的征管数据进行分析、提取、挖掘其隐藏信息数据中的潜能,从海量数据中发现有价值的信息,识别纳税特征,提供差异化的纳税服务,实现信息管税。
  [关键词]税务分析;数据挖掘;大数据;数据利用
  中图分类号:TP311.13 文献标识码:A 文章编号:1009-914X(2016)17-0192-01
  1 引言:
  大数据时代的来临,信息数据越来越多,纳税人数量在快速地增加,税源呈现多元化、复杂化的特征,税源分布的领域越来越广,税源的结构越来越复杂,税源的流动性和隐蔽性越来越强。税务人员需要以更新、更便捷、更有效的方法,对大量的征管数据进行分析、提取、挖掘其隐藏信息数据中的潜能,从海量数据中发现有价值的信息,识别纳税特征,提供差异化的纳税服务,实现信息管税。
  2 税务分析现状
  税务信息化水平代表着一个国家的税收管理水平,甚至影响其财政、国民经济发展水平。作为国家财政收入主渠道的税务行业,是我国政府机关中最早实现信息化的系统之一。近年来,各地税务机关在加强数据管理、深化数据分析应用、探索信息化支持决策与管理模式等方面,做了很多有益的探索,取得了一定成效,但如何有效地进行税收数据分析应用,提高税收管理的整体水平,一直是税务管理部门非常重视并急需解决的课题。
  3 数据挖掘技术和方法
  数据挖掘技术大致分为两类技术,即描述性数据挖掘和预测性数据挖掘两类。描述性数据挖掘以概要方式描述数据,提供数据的一般性质,即导出概括数据中潜在联系的模式。预测性数据挖掘建立一个或一组模型,产生关于数据的预测,即根据其他属性的值,预测特定属性的值。数据挖掘方法则包括关联规则、决策树、聚类分析和离群点检测等分析方法。
  4 税务数据挖掘步骤
  以税务数据挖掘应用角度,挖掘方法可分为这么几步。第一步是概念描述。利用概念描述的方法对行业税负进行分析,为联机数据挖掘提供了可操作的平台。第二步是关联分析。关联性知识挖掘通过测算关联事务的支持度与自信度发现事务发生频繁项集,找出纳税人办理涉税事项之间的序列关联与时间关联;同时,将关联知识用于税源管理中,可以分析企业零负申报与相关因素的关联度,解释困扰税务机关已久的难题。第三步是偏差检测。数据库中的数据常有一些异常记录,这些异常数据的成因可能是来源于不同的类,或者自然变异、收集误差等。偏差检测更多关注的是一个数据对象来源于不同的类,如税收欺骗检测就是通过建立税收数据模型,挖掘出非正常纳税的纳税人信息。
  5 税务数据挖掘应用
  5.1 数据质量校核
  数据质量的高低既是各方关注的热点、又是信息化应用工作的难点,可称之为财税领域研究的“生命线”。数据质量是指数据的优劣程度,或指数据的准确度和可信度。无论税收收入会统核算,还是稽查选案、收入预测、纳税评估等都需依赖数据质量。数据质量评估至少应该包含两方面的基本评估指标:数据对用户必须是可信的,其中包括精确性、完整性、一致性、有效性、唯一性等指标。数据对用户必须是可用的,其中包括时间性、稳定性等指标。可使用数据质量的六元组评估模型对应用系统的数据质量进行评估,构造数据质量评估模型可经过四个步骤:确定数据集评估应用视图,选择评估指标,制定规则集,计算规则结果得分。
  5.2 异常行为发现
  在税务纳税评估和稽查选案管理中,分类规则发现是最常用的数据开采操作,其目的是利用历史数据记录,从中自动推导生成能总结出对给定历史数据的推广描述,可根据纳税人的登记信息、纳税信息、财务指标、以往的违法违章记录等信息,创建预测纳税人的异常纳税的关联规则集,并以此模型作为稽查选案的依据,并能预测未来数据的行为。关联规则数据挖掘可以有效地协助税务机关进行决策分析。可以根据纳税人已有纳税信息和违章情况,进行关联分析,找出涉税经济指标与可能违章手段之間的联系,发现偷、漏税疑点,为税收分析和决策提供依据,提高税务稽查和日常税收管理的效率。
  5.3 纳税行为分析
  利用决策树分类方法进行挖掘分析,通过对纳税人纳税申报信息、纳税人基本信息、办理涉税事项、发票使用等一系列数据实施监控,建立税源检测数据模型,可以帮助税务机关对纳税人的纳税行为进行合理的评价,帮助解决零税负申报、纳税终止行为预测、低税负申报、虚假申报、发票违章等难题。分类在数据挖掘中是一项非常重要的任务,分类的应用非常广泛。分类的目的是让信息系统学会一个分类函数或分类模型,该模型能把数据库中的数据项映射到给定类别中的某一类别。分类也可用于预测。决策树分类方法是特别有效一种分类方法,对税务行业宏观和微观的决策都能起到很好的辅助作用。
  5.4 税收收入预测
  对税收收入进行预测是一件很困难的事情, 主要原因是影响税收收入的因素太多, 但可以通过预测技术给出一个近似值。任何单一的预测模型都只利用了部分有用信息,为保证预测的准确性与可靠性,有必要尽可能综合利用各种预测模型所提供的信息,以达到改善预测效果的目的。组合预测包括等权平均组合预测方法和预测精度组合预测方法。等权平均组合预测方法是组合预测方法中最简单的一种,虽然方法简单,但在对各预测模型的预测精度完全未知的情况下所采用的一种较为稳妥的方法。而预测精度组合预测方法较之等权平均组合预测方法能够更为科学地在各预测模型间分配权重,在各预测模型的预测精度能够确定的情况下,通常使用该方法解决各模型间权重分配问题。
  5.5 税源质量评价
  税源质量是对税源这一经济量优劣程度的度量,既包含着对税源中潜在税收含量的一种度量,又能反映税源规模的变化情况。税源质量越好,表明潜在的税收含量越高,意味着税收产出可能就越多;反之,税源质量越差,税收产出就可能越小。另一方面,税源质量的变化趋势,增长还是萎缩,预示着税收收入的变化趋势,可以通过税源质量的判断来预测税收的变化趋势。税源质量能够反映税源总体中影响税收数量变化的内在因素成份。这种内在因素可能促成税收的增长,也可能造成税收收入减少。税收经济关系中存在很多影响税收数量增减变化的税源内在因素。
  6 总结
  本文对税务系统应用数据挖掘方法开展数据分析进行了初步思考和研究,数据挖掘技术在税务系统有很大应用前景,例如如何建立地区经济发展、企业发展状况与该地区税收收入的相关关系,如何根据税源评价来预估地区或企业税收收入等问题,都需利用数据挖掘方法进行深入研究,并通过对税收数据的深度利用拓展税源管理思路和方法。
其他文献
[摘 要]图书馆的读者服务工作在图书馆与读者之间架起了一座桥梁,其服务质量的好坏将直接影响到图书馆的形象。本文联系高校图书馆读者服务工作实际,探讨提高高校图书馆读者服务工作质量的具体方法。  [关键词]高校图书馆 读者服务  中图分类号:G251 文献标识码:A 文章编号:1009-914X(2016)17-0165-01  前言:高校图书馆作为高校的文献信息中心,是学生获取知识,追求理想的良师益
期刊
[摘 要]城乡规划建设是保证城乡建设有序发展的有力保障,为促进我国经济的稳定快速发展,我们需要对城乡规划建设系统进行必要的健全,以确保其内部各个环节有序且协调,土地管理工作对城乡规划建设有着不可忽视的影响,本文重点分析城乡规划建设过程与土地管理环节的联系,通过对这两个环节的过程优化,找出现实问题的解决办法,以使我国市场经济不断发展。  [关键词]土地管理;城乡规划;影响分析  中图分类号:F301
期刊
[摘 要]城市生活污水处理工艺随着时代的发展有不同工艺的新生,较好的满足了不同城市污水处理需求,需要不断的做技术升级与相关设施的配备来提升污水处理能力,需要不断的提升人们的环保意识,做好污水处理相关工作效率与品质的提升。  [关键词]城市生活污水;处理工艺;关键点  中图分类号:X799.3 文献标识码:A 文章编号:1009-914X(2016)17-0177-01  城市污水主要是城市在生活与
期刊
[摘 要]随着现代都市的发展,大气污染问题越来越突出。本文就大气污染的危害、大气污染综合防治对策进行阐述。  [关键词]大气污染 治理 措施  中图分类号:X51 文献标识码:A 文章编号:1009-914X(2016)17-0169-01  随着现代都市的发展,大气污染问题越来越突出。要想在发展的同时重视环境保护,就要在每个公民的心中树立较强的环保意识。环境保护的意义不在于保护环境,而在于通过保
期刊
[摘 要]当前农业技术以及农业推广还面临着很大的问题,而怎样解决这一问题更是当务之急。那么,农业技术与推广现在要怎样才能摆脱困境呢?文章将结合农業技术和农业推广这两方面来探讨一下。  [关键词]技术 推广 措施  中图分类号:F323.3 文献标识码:A 文章编号:1009-914X(2016)17-0143-01  当今社会,农业技术推广难已经成为事实,我们必须要从根本上解决这个问题。首先,我们
期刊
[摘 要]环境污染问题是我国当前最关注的问题,国家开始从各个方面控制污染。我们生活中常用的塑料袋就是环境污染源之一,对此国家也十分的重视。并于2008年6月执行了强制性塑料袋收费政策,要求全国上下所有的零售商对塑料袋进行收费。政策执行后,塑料袋的消费量减幅巨大,在完全执行政策的超市中,减幅近80%,在未完全执行政策的农贸市场中塑料袋消费量也得到近60%降幅,可以说是成绩显著。“限塑令”对环境污染的
期刊
[摘 要]养殖出优质高产的奶牛是畜牧业中非常重要的一部分,但是在畜牧业中养殖出高产的奶牛是一件非常困难的工作,过程比较复杂,养殖人员不仅仅要在奶牛养殖上有着科学的方法,还要认真做好养殖过程中的每一件小事。  [关键词]奶牛 高产 饲养管理  中图分类号:S8 文献标识码:A 文章编号:1009-914X(2016)17-0183-01  1.对优质奶牛的选择  1.1 对优质奶牛品种的选择  不同
期刊
[摘 要]从苗圃选择、苗床整地、基质配制、种子处理、苗期管理、成品苗出圃及造林等环节介绍一年生容器苗的育苗技术,并对树苗造林的技术措施进行简要分析。  [关键词]阔叶树类 容器育苗 技术 造林  中图分类号:S7 文献标识码:A 文章编号:1009-914X(2016)17-0184-01  1.阔叶树育苗技术  1.1 育苗地点选择  为了便于运输和管理,在选择苗圃时首先要考虑交通、水利条件。其
期刊
[摘 要]技工院校要实现多元化发展,需应用“工学结合”的理念来提高教学质量、提升教学效率、深化教学改革。创新开发具有职教特色的教、学、做一体的教学模式,并完成与之相适应的教师队伍、教学标准与教学场所等方面的改进。  [关键词]工学一体化 改革现状  中图分类号:G712.0 文献标识码:A 文章编号:1009-914X(2016)17-0188-01  随着我国经济的腾飞,我国新型工业化对技能人才
期刊
[摘 要]本文就标准化管理在大豆生产中的地位、作用及体现进行了简要分析,阐明了大豆标准化管理的方向性、重要性及可操作性,以供参考。  [关键词]大豆 标准化管理  中图分类号:C93 文献标识码:A 文章编号:1009-914X(2016)17-0181-01  1.标准化管理在大豆农业生产中的地位  在大豆生产实践过程中,开展很多生产实验、科技攻关和技术开发活动获得成功的,往往不单纯是技术的功劳
期刊