论文部分内容阅读
随着国内金融体制改革的不断深入,各种新的金融服务不断出现,银行业正经历着前所未有的深刻变革,如何提高银行的市场竞争能力,迅速做出更好的决策,是各家银行迫切需要解决的问题。与此同时,银行近几年的信息化建设使其具有了数量大、涉及面宽的数据。那么如何处理这些数据从而可以为经营决策提供有益的信息,银行界进行了广泛的探索,于是数据挖掘技术在银行界得到了广泛的认同。 数据挖掘技术在银行领域可应用的范围非常广泛,如客户关系管理、风险分析与控制、资金匹配、金融产品的赢利分析等等。本文选择以全成本分析作为突破口,可以将银行经营决策的着眼点从财务会计上升到管理会计层面,为银行运营成本的控制以及综合盈利能力的提升提供科学的依据。本文旨在利用数据挖掘和知识发现的最新研究成果,探寻与之结合的银行经营管理具体领域,尝试银行决策知识的自动获取。 本文总结了与银行全成本分析相关的研究和算法,重点研究了基于关联规则的分类算法(CBA, Classification Based on Association)。基于关联规则的分类算法是原新加坡国立大学Bing Liu教授首创的工作[12],它的基本思想是:利用任意关联规则算法(如:FP-growth),只挖掘条件属性与决策属性之间的关联,作为分类规则;以规则的support和confidence度量规则的重要性,按重要性由高到低的顺序排列所有规则,并用训练样本对排序后的规则集进行修剪,最终获得分类器。 为了验证分析的正确性,本文尝试了几种类型的分类算法对银行全成本数据进行训练。根据训练结果,提出了基于关联规则的分类算法更适合银行全成本分析系统;最后根据基于关联规则的分类算法建立了银行产品盈利等级的预测模型,以银行产品的属性描述和成本信息为输入,预测该产品的盈利情况,并输出了一些具有实际应用价值的规则,为银行经营提供可靠的决策支持。 由于与全成本分析系统相关的各业务系统非常繁多,业务接口不是很规范;且银行全成本的分析指标会因为不同的业务要求而不同,这就要求分析模型的数据获取方式要相对灵活,本文提出了采用BPEL4WS在银行各业务子系统间采集数据,为知识发现做数据准备。