论文部分内容阅读
近年来,尽管全球经济发展疲软,但在我国经济持续高速的发展带动下,我国信用卡产业发展势头迅猛;同时由于互联网支付手段及手机支付手段的不断普及,使得信用卡行业发展获得持续的推动力,信用卡发卡量持续增长。由于信用卡交易次数和交易金额的大幅提升,信用卡风险管理仍旧是业界十分关注的问题,信用卡欺诈风险作为风险管理的重要组成部分,研究信用卡欺诈识别有十分重要的现实意义。信用卡欺诈行为有发生频次低、造成危害大等特征,一般手段难以进行有效识别防范,因此需要运用数据挖掘的方法进行信用卡欺诈识别研究。在信用卡欺诈识别研究中,主要难点在于欺诈行为数据相对较少,夹杂在正常数据中难以提取欺诈行为特征,需要利用稀有类分类的方法进行信用卡欺诈识别。本文结合前人研究成果,提出将不均衡数据集处理和分类算法组合进行稀有类分类。通过聚类处理不均衡数据集,解决不均衡数据集中样本分布不均的问题。然后运用Adaboost算法进行稀有类分类,针对Adaboost算法易受离群样本影响的缺点,本文提出通过改进样本权重更新机制,提升类别边界样本的权重,同时减少离群样本权重的扩散幅度,减少对分类精度的影响。本文以不均衡数据集处理和分类器训练为基础,提出新的信用卡欺诈识别模型的构建方法,通过实验证明,该模型能够有效识别欺诈行为,为信用卡欺诈防范提供新的解决思路。本文共分6章,第1章对国内外欺诈识别的研究进行综述,并对本文提纲进行概述;第2章对稀有类分类的方法进行了系统分析,提出本文的稀有类分类的思路;第3章研究了不均衡数据集的处理方法,选择k-means聚类算法提升不均衡数据集的均衡度;第4章对Adaboost算法的权重更新机制进行改进,提出了基于Adaboost的稀有类分类算法;第5章基于前文研究工作构建信用卡欺诈识别模型;第6章对全文的研究成果进行总结及展望。