基于朴素贝叶斯分类算法的金融数据挖掘研究

来源 :今日财富 | 被引量 : 0次 | 上传用户:whitewolfwv7
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:介绍了朴素贝叶斯分类算法的理论,研究了朴素贝叶斯算法在信用卡金融数据挖掘中的应用。实验结果表明了朴素贝叶斯算法是一种非常有效的算法。
  关键词:朴素贝叶斯算法;分类;数据
  Abstract:In this paper, the na?ve bayes classification algorithm theory is introduced. The application of na?ve bayes classification algorithm in credit financial data mining is researched. The experimental results indicate that the na?ve bayes classification algorithm is an effective algorithm.
  Key words:Na?ve bayes algorithm; Data mining; Credit
  一、引言
  近年来,数据挖掘技术在金融领域中的应用备受关注[1]。朴素贝叶斯分类(Naive Bayes,NB)方法[2,3]是一种著名的数据挖掘算法,它基于贝叶斯理论,具有简单而有效的特征。本文首先说明了朴素贝叶斯分类算法的原理和方法,而后研究了朴素贝叶斯算法在信用卡金融数据挖掘中的应用,实验结果表明了朴素贝叶斯算法是一种非常有效的分类算法。
  二、朴素贝叶斯分类算法
  对于任意样本 ,其特征为 ,特征中 表示样本 中出现的第i个特征项。样本的类别为k个,即 。假设在给定的条件下,特征项之间不存在任何依赖关系,都是相互独立的。那么根据朴素贝叶斯分类算法,样本 与已知各类的条件概率 定义为: (1)
  因为 对计算结果没有影响,所以可以省略。而 (2)
  其中, 和 可以通过如下的公式来估计: (3) (4)
  其中 表示类 中的样本数目, 为特征项 在类 中出现的词频总数。
  对样本 进行分类,就是按公式(1)计算所有样本类在给定 情况下的概率,概率值最大的那个类就是 所在的类,即:
  (5)
  三、实验分析
  (一) 数据集
  实验中采用的数据集是在UCI数据库[4]中的Credit Approval数据集。Credit Approval数据集包括了16个属性,共有690个样本。
  (二)评价指标
  本文采用精度来衡量分类算法的性能。分类器对样本的分类结果有4种情况。
  TP:被正确地分类为属于此类别的样本数量。
  TN:被正确地分类为不属于此类别的样本数量。
  FP:被错误地分类为属于此类别的样本数量。
  FN:被错误地分类为不属于此类别的样本数量。
  根据以上4种情况,分类性能可以按照精度来评价,精度的定义如下:
  (6)
  (三) 分类结果
  对于分类性能的评价方法,实验中采用的是十折交叉验证法。作为对比分析,实验中也采用ZeroR算法对数据集进行分类,得到其分类结果。朴素贝叶斯分类算法、ZeroR算法在Credit Approval数据集上的分类精度如图1所示。
  图1 两种算法的分类精度比较
  图1中的实验结果表明朴素贝叶斯算法的分类精度高于ZeroR的分类精度。朴素贝叶斯算法在数据集上得到的分类精度是77.6%,而ZeroR算法的分类精度为55.5%。
  四、结论
  本文介绍了朴素贝叶斯分类算法的原理和方法,研究了朴素贝叶斯分类算法在金融数据挖掘中的应用实例。实验结果表明了朴素贝叶斯分类算法是一种有效的分类方法,在金融数据挖掘中有很好的应用价值。
  参考文献:
  [1] 马超群.金融数据挖掘,科学出版社, 2007.
  [2]Lewis, D.D. Naive (Bayes) at forty: the independence assumption in information retrieval. In: The 10th Euro-pean Conference on Machine Learning, New York: Springer. 1998: 4-15.
  [3] 余民杰,王元亮. 朴素贝叶斯分类算法研究,商情, 2012(8):226-227.
  [4] BLAKE C L, MERZ C J. UCI repository of machine learning databases. http://www.ics.uci.edu/~mlearn/MLRepository.html.2016.
其他文献
摘要:城市园林是城市建设体系中一个必不可缺的内容,其在改善城市生态环境、美化景观环境方面有着无法比拟的作用,能否做好城市园林管理工作将直接影响到城市居民生存环境、生活质量的好坏。  关键词:城市园林;绿化;经济发展;关系  一、城市园林绿化与经济发展的关系  (一)与城市经济发展相结合的园林绿化特征  城市的发展必须依靠城市经济的发展。当社会经济发展滞后、发展缓慢,政府的主要目标是推动经济发展,即
期刊
摘要:在影厅音响系统工程设计的过程中,必须坚持科学严谨的原则,并严格选用具有适用性以及合理性的设施设备,然后对其进行细致的调试,这样才能保证影厅的音响系统在运行的过程中能够保持最佳的状态,从而使得音响的效果能够更加的自然悦耳。本文对影厅音响系统工程设计进行了深入的分析和详尽的阐述,并对建设实践的过程作了详细的阐述,仅供相关人士进行参考。  关键词:影厅;音响系统工程;设计;建设实践;分析  一、影
期刊
摘要:随着国家经济的迅猛发展,市场竞争愈演愈烈,致使建筑行业受到一定程度上的影响。在此背景下,建筑企业为在激烈的竞争中占有一席之地,应重视成本管理问题,采取切实可行的措施,优化成本管理,为建筑企业长足发展奠定基础。鉴于此,本位笔者将以建筑经济中成本管理的重要性为出发点,简述建筑经济中成本管理存在的问题,并提出相关的应对措施,以供相关人士参考。  关键词:建筑企业;成本管理;问题;应对建议  一、建
期刊
摘要:网络游戏产业高速发展的同时所引发的一系列法律和社会问题的纷争也相继频繁发生,尤其网络游戏中虚拟财产的法律地位、流转形成的法律责任、玩家的权利保护等诸多法律和社会问题成为纠纷的焦点。深入探讨和厘清这些问题有助于网络游戏产业健康发展。  关键词:虚拟财产;法律属性;刑法规制  一、虚拟财产的定义及特征  虚拟财产是伴随着互联网技术生成的一个新名词。所谓的虚拟财产,究其本质可分为两部分,其中一部分
期刊
摘要:过去,我国民办院校在实施绩效考核过程中,普遍采用传统形式考核教职工的绩效,这造成了绩效考核管理出现效率低、不透明等问题。随着信息化的发展,各民办院校逐渐地将信息化引入到教学、科研、管理以及信息发布等学校日常工作中。  关键词:民办院校;信息化;绩效考核  近年来,民办职业院校逐渐成为我国高等教育的重要组成部分。如何对民办职业院校进行合理有效的绩效考核,是目前民办职业院校人事管理中亟待解决的问
期刊
摘要:企业安全生产风险抵押金在实践中存有突出矛盾,在理论上有改废之争,笔者分析了企业安全生产风险抵押金的本质属性:金钱质押、强制缴纳和风险预防,提出改善新论,以行政担保和风险预防的理念,贯彻该制度的改进,并提出了具体实施措施。  关键词:企业安全生产风险抵押金;行政担保;金钱质押;风险规制;责任保险  一、缘起:问题的提出  一真实案例,某H省X市煤矿职工赵某,在入职之前,就被告之,政府的强制性规
期刊
摘要:本文以徐州市泉山区为例,对随迁老人的社会融入状况进行调查研究。从经济、文化、社会交往、心理四个方面出发,通过问卷调查和个案访谈的方式,力求全面、客观地展现随迁老人的社会融入程度以及在这一过程中遇到的困难。  关键词:随迁老人;社会融入  一、研究背景  据第六次人口普查统计数据,我国流动人口已达约2.6亿。众多老年人跟随子女前往异地生活,形成随迁老人大军。基于我国老龄化的加剧、人口流动性的增
期刊
摘要:自2003年成立以来,中国银行业监督管理委员会一方面严格控制银行业风险,一方面引导行业发展并且更好地为实体经济服务,在中国特定的体制条件和经济发展模式下拉开了以风险控制为本的银行业监管实践。然而,随着我国金融市场的快速发展,银行业监管的问题也日渐显现。怎样促进银行业监管体系的进一步完善,成为我国经济是否能够健康、有序运行的关键。  关键词:银行业;监管;问题;对策  一、我国银行业监管概述 
期刊
摘要:近年来,中小银行传统的业绩评价指标逐渐落伍,经济增加值(EVA)这一评价指标凭借其独特的优势开始被广泛应用。本文基于前人的研究成果,通过实证研究法,选取国内10家中小银行近4年的数据为样本进行实证研究,利用回归模型分析出影响中小银行EVA的驱动因素,并对驱动因素进行追踪、分析,以期提高中小银行经营管理水平。  关键词:中小银行;EVA;驱动因素  一、绪论  (一)研究背景与意义  近年来,
期刊
摘要:随着我国对外贸易的不断发展,高技能应用型的贸易人才以成为各用人单位的首选,而我国高职院校所培养的国际经济与贸易专业的学生在实践能力方面明显较弱,针对所存在的问题,就实训实践教学提出一些可行措施。  关键词:国际经济与贸易;实训;仿真  一、解决校外实习不足的有效途径  在当前形势下,学生由学校统一安排到企业进行国际贸易的校外实习正面临一些困难,究其原因:(1)高等职业教育着重对学生职业技能和
期刊