论文部分内容阅读
随着信息技术的发展和计算机应用的日益普及,电子化数据越来越多,在海量数据面前,人们正面临“数据丰富而知识贫乏”的问题。上世纪八十年代末兴起的数据挖掘(data mining)技术和数据库中的知识发现(knowledge discovery in database,KDD)技术为解决此问题开辟了一条道路。经过30多年的发展,数据挖掘技术已经被广泛应用于各行各业的数据分析和知识发现领域,已经取得了很大的成果。然而,目前数据挖掘技术还存在着许多问题:(1)数据挖掘系统仅提供孤立的知识发现功能,难于嵌入大型应用系统中;(2)数据挖掘工具与数据库或数据仓库系统是松散耦合的;(3)数据挖掘行业是高度分散的,公司和研究机构独立开发各自的数据挖掘系统和平台,没有形成开放性的标准,无法提供跨平台支持,不能提供跨数据库系统的支持。因此,在数据挖掘过程中要花费大量的时间进行数据加载、转换,而且算法运行时间长、效率低。为了方便数据挖掘的应用,设计和开发数据挖掘系统已经成为目前研究的热点。从理论角度,本文首先介绍了国内外数据挖掘系统的研究历史与现状,分析数据挖掘的整个流程和实施步骤,然后在已有的数据挖掘体系基础上,对数据挖掘系统与数据库系统的关系进行深入研究和探讨,提出将一个数据库嵌入到数据挖掘系统中的观点,使数据挖掘系统与数据库系统紧密耦合。分析数据挖掘系统中采用嵌入式数据库的原因,将Derby嵌入式数据库以Eclipse插件的形式嵌入到数据挖掘系统中,设计嵌入式数据挖掘系统。从应用角度,本文选取A银行信用卡业务作为分析背景,详细调研及分析A银行信用卡中心组织现状及信用卡风险管理方法,确定A银行信用卡风险管理业务中存在的问题,对影响A银行信用风险的关键因素进行分析,并对客户行为模式进行关联分析,创新性的提出将嵌入式数据挖掘技术应用到信用卡风险管理业务中。对传统的Apriori算法进行优化,针对嵌入式数据挖掘在A银行信用卡风险管理中的应用,采用传统的Apriori算法与优化的Apriori算法在验证环境下的嵌入式数据挖掘系统上进行关联规则数据挖掘,提高挖掘效率,为A银行在信用卡管理方面提供决策参考,减少信用欺诈行为,并且验证优化的Apriori算法在嵌入式数据挖掘系统上的高效性。本文从嵌入式数据挖掘技术相关基本理论研究入手,以A银行信用卡风险管理数据挖掘系统为启发性思考,对嵌入式数据挖掘系统从业务分析、数据挖掘流程分析、系统需求分析、系统设计等方面进行深入研究。