【摘 要】
:
应用数据挖掘技术,加强税收数据进行分析,为税务系统强化科学管理提供有价值的决策信息,已经成为当前税务系统的一个研究热点。本文针对当前税收执法管理工作中存在的不足,结合税
论文部分内容阅读
应用数据挖掘技术,加强税收数据进行分析,为税务系统强化科学管理提供有价值的决策信息,已经成为当前税务系统的一个研究热点。本文针对当前税收执法管理工作中存在的不足,结合税收行业数据特点,提出了一种基于hash和项集空间划分的关联规则挖掘算法-SAVM算法,并将关联规则挖掘技术和SAVM算法应用到税收执法数据分析中,找出了税收执法过错行为和税收执法者特征之间的关联关系,为税务系统加强税收执法管理提供了非常有价值的参考信息。本文的主要工作和创新点如下:一、阐述了数据挖掘技术在税务系统的应用现状,全面介绍了税收执法管理的内容、方法和存在的不足,分析了应用数据挖掘技术开展税收执法数据分析的重要意义。二、阐述了数据挖掘的基本理论、主要技术、知识分类、常用挖掘工具和研究趋势,深入研究了关联规则挖掘技术,重点介绍了几种经典关联规则挖掘算法,分析了各种挖掘算法的优、缺点,指出了关联规则挖掘技术的研究热点和发展趋势。三、提出一种基于hash和项集空间划分的关联规则挖掘算法-SAVM算法。将事务数据库转换成比特向量表示形式,通过向量的与运算来计算项集的支持度,在挖掘过程中只需扫描一遍数据库;运用hash技术,在第一次扫描数据库的过程中,直接生成频繁2项集,提高算法的执行效率;采用基于共同前缀的划分方法,将己生成的频繁项集划分到不同的子空间,在每个独立的子空间内生成候选项集,减少连接次数。实验结果表明,SAVM算法提高了关联规则挖掘的效率。四、将关联规则挖掘技术应用到税收执法数据分析中,详细阐述了数据选择、预处理、挖掘频繁项集和生成关联规则等处理过程,对生成的规则进行了分析,得出了对税务系统加强税收执法管理具有重要参考意义的结论。同时,也为将关联规则挖掘技术应用到税收管理的其他领域提供了一个可供借鉴的方法。
其他文献
传统网络,即Internet和Intranet等当前主要网络形式,曾经给人们的生活带来了质的飞跃。今天,面对人们对多媒体视视频音频信息的实时、高品质的传输要求,传统网络却遇到了前所
矢量场可视化,尤其是流场可视化是海洋信息可视化应用研究领域的一个重要课题,更是科学计算可视化领域研究已久的一个古典分支。现实中存在许多矢量场,比如水流场、气流场等,
雷暴是影响飞行安全的重要天气现象之一,目前尚缺乏专门针对影响飞行安全的小尺度天气现象的预报模式。粗糙集方法可在对数据样本内在依赖关系认识不足的情况下,进行有效推理,粒
为了适应越来越多的来自高清晰度(HD)和标准清晰度(SD)广播和存储产业的需求,我国制订了具有自主知识产权的音视频编码标准(AVS)。该标准可以在编码效率和编解码复杂度之间达
随着无线传感器网络在各个领域的广泛应用,其面临的安全威胁也日益严重。然而传感器节点的存储空间、计算能力、通信带宽等资源严重受限,传感器网络特殊的部署环境、开放的无
随着计算机网络技术和通信技术的相互融合,以这两项技术为基础的计算机支持协同工作(Computer Supported Cooperative Work,CSCW)技术,得到了快速的发展。传统的协同架构,广
无线传感器网络是目前信息领域里一个重要的研究热点,已在多个方面得到广泛应用,如:国防军事,航空航天、环境监测、交通医疗、反恐抗灾等方面,在未来也具有很好的发展和应用前
研究生信息管理系统是实现研究生教育管理的重要组成部分,是研究生教育信息化程度的重要标志,对提高研究生教育管理水平、节约人力资源、实现信息资源共享,实施科学管理起到重要
随着实时CORBA(Common Object Request Broker Archi tecture,通用对象请求代理体系结构)技术的日趋完善及应用的需求,越来越多的分布式实时系统建立于其之上。在分布式实时系
随着计算机技术的发展,计算机安全事件频繁发生。计算机取证(computer forensics)正是在这种形势下产生和发展的,它可以对犯罪分子产生威慑作用。当前,分布式拒绝服务攻击(DD