一种税收优惠政策的精准推荐方法

来源 :科学导报·学术 | 被引量 : 0次 | 上传用户:kage
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:在税务领域如何对纳税人的税收优惠政策推广更具有针对性、引导性,使能享受税收优惠政策的纳税人及时充分享受税收优惠政策的红利,是税务机关精准服务的难点之一。本文利用文本相似度以及改进的推荐算法确定两个目标集合,然后通过两个集合取并集的方式确定最终目标纳税人群体,实现税收优惠政策的精准推荐服务。
  关键词:税收优惠政策;精准推荐;文本相似度;推荐算法
  中图分类号:TP3 文献标识码:A
  引言
  现有的税收优惠政策宣传主要通过纳税学堂辅导、专题讲座、网站政策公告等传统的方式,传统方式一方面时效性较差,另一方面对纳税人没有针对性,使很多满足要求的纳税人无法及时享受优惠政策的红利。
  推荐系统[1]的应用已经在多个领域进行使用,本文旨在将推荐系统在税务精准服务中进行运用,又考虑到税收优惠政策自身的业务性,通过运用NLP(自然语言处理)分析税收优惠政策和纳税人之间的关联关系,同时结合推荐算法构建融合模型,以便更精准地把税收优惠政策推荐给真正需要该政策的纳税人。
  1材料与方法
  1.1使用NLP获取第一目标集合
  步骤101:获取纳税人的基本信息,包括行业类型、经营范围、资格类型、企业类型、组织机构类型、缴税信息、职工信息以及已享受税收优惠政策信息。
  步骤102:利用TF-IDF[2][3]对所述基本信息进行数据提取转换,得到基本信息特征向量。
  步骤103:获取纳税人当前享受的税收优惠政策。
  步骤104:对所述税收优惠政策进行数据提取,得到税收优惠政策特征向量。对所述税收优惠政策进行分词,得到多个第二关键词;对多个所述第二关键词进行优化,得到优化后的第二关键词;根据所述优化后的第二关键词,确定税收优惠政策特征向量。
  Step1:生成税收优惠政策关键词。获取正在享受的所有税收优惠政策的文件,根据文件内容结合已享受纳税人信息,通过分词生成税收优惠政策的关键词;
  Step2:利用TF-IDF计算税收优惠政策特征向量,计算与已享受纳税人的相似度,针对与已享受纳税人相似度较低的税收优惠政策进行关键词优化;
  Step3:重复Step2直至60%以上的税收优惠政策与已享受纳税人的相似度均不为0,确定最终关键词并形成税收优惠政策特征向量。
  步骤105:计算所述基本信息特征向量与所述税收优惠政策特征向量之间的相似度。
  相似度S计算如下[4]:
  其中Ai为第i个税收优惠政策的n维特征向量,Bi为第i个纳税人的n维特征向量,θ为两特征向量的夹角。
  步骤106:根据所述相似度以及设定阈值,获取第一目标纳税人集合。通过设定相似度S大于阈值T获取目标纳税人;阈值T根据税收优惠政策不同而不同,设定为某一税收优惠政策与已享受纳税人的相似度的最小值。基于内容利用NLP分析获取的目标纳税人集合U1={U1(i),i=1,2,...,n},其中U1(i)为NLP获取的税收优惠政策i的第一目标纳税人集合。
  1.2使用推荐算法获取第二目标集合
  通过协同过滤算法[5],基于改进的相似度,获取第二目标纳税人集合。
  步骤1:计算纳税人同现相似度,找出与目标纳税人相似的纳税人集合。纳税人同现相似度为改进的余弦相似度,计算如下:
  其中表示纳税人和纳税人的相似度,表示纳税人享受的税收优惠政策集合,表示纳税人享受的税收优惠政策集合,是享受税收优惠政策的纳税人集合,分子中的倒数惩罚了纳税人和纳税人共同享受的税收优惠政策中热门税收优惠政策对他们的相似度影响[6]。
  步骤2:找出纳税人集合中相似納税人享受的、但目标纳税人没有享受的税收优惠政策推荐给目标纳税人。纳税人对税收优惠政策的兴趣度计算如下:
  其中表示纳税人对税收优惠政策的兴趣度,表示纳税人对税收优惠政策的兴趣,此处等于纳税人享受税收优惠政策的次数。基于行为利用改进的基于用户的协同过滤算法获取的目标纳税人集U2={U2(i)i=1,2,...,n},其中U2(i)为改进的基于用户的协同过滤算法获取的税收优惠政策i的第二目标纳税人集合。
  1.3最终目标集合确定
  根据所述第一目标集合U1以及所述第二目标集合U2,最终目标集合通过两者取并集来获取。享受税收优惠政策i的纳税人集合U(i)=U1(i)∪U2(i),最终目标集合U={U(j),j=1,2,...,n},其中j代表第j个税收优惠政策。
  2结论
  (1)基于税收优惠政策内容与已享受的纳税人信息的关联性,利用NLP不断训练税收优惠政策关键词,建立“税收优惠政策词库”;
  (2)改进的基于用户的协同过滤算法,纳税人相似度计算中消除了热门税收优惠政策对纳税人的相似度影响,使算法得到的结果更具有现实意义;
  (3)将NLP与协同过滤算法相结合,取两种模型获取的纳税人集合并集作为最终目标群体,实现税收优惠政策的精准服务,在避免传统的无针对性的广撒网模式的同时又能尽量保证目标群体无遗漏,精准找到目标群体;在给税务干部提供管理决策支撑的同时,为纳税人推送个性化服务,为税务行业的精准服务提供便捷。
  参考文献
  [1] 孟祥武,胡勋,王立才,等 . 移动推荐系统及其应用 [J]. 软件学报,2013,24(1):91-108.
  [2] Gu Y,Yang Z,Xu G,et al. Exploration on efficient similar sentences extraction[J]. World Wide Web,2014,17(4):595-626..
  [3] 周丽杰,于伟海,郭成. 基于改进的TF-IDF方法的文本相似度算法研究[J]. 泰山学院学报,2015,37(003):18-22.
  [4] 张启宇,朱玲,孙爱娥. 文本相似度的计算[J]. 电脑知识与技术:学术交流,2008.
其他文献
摘要:现如今互联网技术已经在许多领域中得到渗透,促使多个行业的商业模式发生改变。因此,物流管理行业同样需要做到与时俱进,通过应用大数据技术,调整原有的管理模式,从而为人们提供更为优质的服务,提升自身经济效益。本篇文章主要描述了大数据给物流业带来的机遇,并对于大数据环境下物流管理的创新方法发表一些个人的观点和看法。  关键词:大数据环境;物流管理;创新  引言:  对于大数据而言,由于信息量极为庞大
期刊
摘要:近年来我国社会行业的不断发展,电气工程项目在我国各行各业都得到了较为广泛的用。随着我国工业制造业的快速发展,尤其是现代工业体系的建立带动了电气自动化技术的发展。电气自动化工程控制系统是实现现代工业发展的核心要素,加快推进控制系统的技术创新,构建智能化、网络化、集成化的人工智能控制系统是当前我国现代制造业发展所必须解决的问题。本文就电气自动化工程控制系统的现状及发展展开探讨。  关键词:电气自
期刊
摘要:我国自改革开放以来,社会发展日渐加快。对于新型能源资源的追求已今时不同往日。为了保障社會资源可持续发展,在发电工程中应用新能源是发电工程改革的重要方向。本文将探究在发电工程中新能源造价控制路径,首先归纳与总结当前新能源发电工程造价管理存在问题,其次通过分析新能源资源控制措施,旨在提高发电工程中新能源应用的经济效益。  关键词:新能源;发电工程;造价控制;措施  在新能源工程中,其成本支出一直
期刊
摘要:现如今,城市人口数量明显增多,城市交通压力也随之增大,城市道路拥堵现象日益普遍。為解决上述问题,应切实加强城市道路规划,减轻城市交通压力。城市轨道交通建设和发展中,存在着十分明显的问题,需转变城市交通轨道发展方向,顺应现代化城市前行趋势。  关键词:城市轨道交通;可持续发展;交通压力  城市轨道交通在城市交通系统中占据重要位置。为有效减轻城市交通压力,部分大城市高度重视轻轨铁路建设。推动轨道
期刊
摘要:世界观对人们的价值判断和价值选择起到引导作用,在成长的过程当中儿童如果不能树立正确的世界观、人生观和价值观,很容易会导致学生在价值判断和价值选择的时候做出错误的选择,造成不良的影响,为了更好地提高儿童的价值判断和价值选择能力,就需要加强对儿童的心理健康教育。而对于儿童的心理健康教育,仅凭学校的力量是不够的,还需要家庭教育的配合,才可以让心理教育达到最佳的效果,为此本文就家校合作在儿童心理健康
期刊
摘要:探究活动是学生学习科学的重要方式,强调从学生熟悉的日常生活出发,通过学生亲身经历动手动脑等实践活动。在开展实践探究活动中,农村小学有其得天独厚的资源优势优势。然而,教师必须巧妙利用农村的天然环境,充分利用资源优势,优化科学教学方式,才能提高科学教学效率。  关键词:农村小学;科学教学;地方资源  小学科学课程的基本理念,首先是要面向全体学生,无论学生之间存在着怎样的地区、民族、经济和文化背景
期刊
摘要:LED作为一种新型光源,具有高效节能、绿色环保、色彩丰富等特性,被誉为人类照明史上的希望之光。本文设计的多功能白光LED台灯系统,采用PT4115大功率LED恒流驱动方案,可实现对LED台灯的PWM多级调光控制;系统兼有USB充电、自动感应开关等多项功能。实验证明,该多功能LED台灯稳定高效,功能丰富,能够满足人们多层次的需求。  关键词:LED照明;多级调光;自动感应  1系统电路设计  
期刊
摘要:现代汽车故障诊断与排除技术,通常指在不对汽车进行解体研究的情况下,通过相关诊断仪器与设备结合计算机、自动控制等技术对车辆的维修质量、工作能力等相关性能进行测试、检查、诊断、鉴定的技术。为克服实训教学过程中整车故障诊断与排除教学中存在的问题,对相关发动机排故教学设备进行创新性研究,是十分必要的。本文以机械工程学相关理念为基础,结合汽车发动机相关领域的知识,着重分析了发动机排故教学设备应具备的特
期刊
摘要:随着甚低频固态发信机在部队的装备使用,固态发信机的日常使用、维护、管理是部队重要任务之一,急需把握发信机的特点和规律,分析发信机的常见故障和解决策略,为对潜通信提供重要保障,本文重点总结分析了发信常见故障及解决方法,为长波台的通信执勤提供有力的技术保障,进而有效的提升了部队的战斗力。  关键词:固态发信机;常见故障;解决策略  引言  甚低频通信是指频率为3—30kHz的无线电波进行远距离信
期刊
摘要:文章使用反映中国老年健康影响因素跟踪调查的CLHLS数据库,以老年人口生活评测满意度作为研究指标,从身体、经济、心理、社会保障几个方面入手,构建面板二值选择模型进行了研究。其中身体健康水平、收入程度、养老金,社会医疗服务得到保障后对老年人口生活满意度具有显著正向促进作用,而老年人群孤独感则形成对满意度的负向影响;文章以此为依据,从满意度为切入点,反映出我国老年群体的养老生活诉求,寻找符合老年
期刊