论文部分内容阅读
随着中国加入WTO以后,银行业的服务将是其盈利的最主要手段。而这些原有的和不断增加的服务并不适应于其所有的客户群体,所以要对客户的信息进行分析,对其进行有效的分类,找出某种服务所适应的群体。这样可以为银行有效地节省大量的成本,从而提高其盈利能力,使得我国银行业能够在激烈的国际竞争环境下,处于不败之地。随着近几年来经济的快速发展,国内的银行业务也随之迅猛发展,在其为银行带来大量客户源和丰厚利润的同时,却也使得信用评估的工作量剧增,以往仅靠个人经验的信用评估模式已经力不从心了,因此对于客户信用评估的智能化研究就越来越显示出其举足轻重的重要意义。 数据挖掘是一种融合了数据库、人工智能和数理统计等多学科特点的新技术。它是从大量、复杂的数据中迅速获取新颖、有效知识的过程。分类是一种最常见的数据挖掘任务,它通过经验数据训练得到的分类器来预测未知数据的类别。 支持向量机是数据挖掘中的一种新方法,以其优秀的理论基础即结构风险最小化理论、条件二次优化理论和核空间而倍受关注。其核心思想是将一个复杂的分类任务通过核函数映射使之转化成一个在高维特征空间中构造线性分类超平面的问题。它具有全局最优、结构简单、推广性好等优点。近年来已经在手写数字识别、人脸识别与人脸检测以及文本分类等模式识别领域有了很好的应用。 本文首先介绍了课题的应用背景、信用评估的现状和现存的个人信用评估方法,提出了一种改进的银行客户信用评估方法。然后介绍了数据挖掘中常用的分类方法,通过比较各种分类方法的优点和缺点,最终选用支持向量机。 其次,深入研究了支持向量机的理论和算法。重点研究了Platt提出的序列最小最优化算法(SMO),实现了Keerthi提出的改进的序列最小最优化算法,并且实现了线性核、多项式核、径向基核和Sigmoid核四种核函数。 再次,设计和实现了基于支持向量机的银行客户信用风险评估原型系统,并把该系统应用于国外某商业银行客户信用风险评估。该原型系统实现了数据预处理模块和SVM分类模块(两分类SVM算法和一对一的多分类SVM算法)。通过所构建模型的预测准确率对比,证明了改进后的客户信用评估方法优于原有的打分方法。 最后对全文的工作进行了总结和展望。