面向银行信贷分析的关联规则挖掘算法研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:yangxzguoli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着社会的发展,银行业务呈多样化,个人信贷业务逐渐兴起,盈利空间非常大。目前,大部分银行主要依靠工作人员根据自己的经验对客户进行评估来决定是否放贷,这其中主观性很强,对评估结果有一定的影响。如果能够通过数据科学地分析出哪些人在银行交易中信用度较高,那么就可以对这些人进行放贷,进而增加银行收益。在众多挖掘算法中,Apriori算法被人们使用的最多,近些年已被应用于对各行各业数据的挖掘研究。在Apriori算法的运行过程中,它是存在一些缺点的。其一是在数据库扫描方面,会进行多次扫描,这无疑会增加I/O开销。其二,在自链接过程中产生的候选项集过多,算法运行时间长。其三,Apriori算法是串行算法,无法满足大数据的挖掘。本文分析了改进的AprioriTid算法,然后分析该算法的不足,提出对项集约减和排序的改进算法Apriori_Cut。该算法只扫描一次数据库并能减少数据集,减少数据集的遍历,还能够减少候选项集的个数,避免无用的候选项集的产生。本文首先介绍了选题背景与意义,然后对研究所能用到的相关理论知识进行了详细介绍。接着研究介绍了 Apriori算法原理。随后,我们分析了传统Apriori算法和改进的AprioriTid算法,针对算法的不足之处对算法进行了改进,提出了 Apriori_Cut算法。然后将Apriori算法、AprioriTid算法、Apriori_Cut算法移植到Hadoop平台上以适应大数据的挖掘。接下来将三种并行算法进行了实验对比,实验证明Apriori_Cut算法优于其他两种算法。最后,我们以国外某银行的信用数据作为本次课题的研究,先对这些数据进行了预处理,然后运用大数据处理平台Hadoop来处理数据,并制作了一个web应用小程序,运用并行化Apriori_Cut算法对银行信用数据进行挖掘并详细地分析了挖掘结果,总结出了哪些人的信用度较高,挖掘结果可以指导银行进行合理放贷。
其他文献
有压管道在城市市政系统中扮演着重要的角色,近些年随着管道生产设备和生产工艺的改进,有压管道的材质越来越多样化,其中具有粘弹力学特性的塑料管道应用越来越普遍,然而,粘
玉带凤蝶(Papilio polytes L.)属凤蝶科(Papilionida)凤蝶属(Papilio),幼虫主要取食为害芸香科(Rutaceae)植物叶片,是柑橘的重要害虫之一。该虫在我国广泛分布于两河流域至台
缝洞型油藏储层非均质性强,油水关系复杂,而且缝洞本身的结构和尺寸也具有多样性,给开发造成巨大的难度。TH油田目前主要以注水替油的方式进行开采,但在开发的后期,注水替油
作为一种激光测距方法,调频连续波激光测距是通过频率线性调制的发射信号与回波信号形成的稳定的拍频信号,再对拍频信号通过快速傅里叶变换来提取出待测目标距离信息的。较其
目的本研究旨在观察分组交叉选穴耳穴埋籽对中风后便秘患者的确切临床疗效,及对血清SP、VIP含量的影响,并进一步探讨耳穴埋籽治疗中风后便秘可能的作用机制。寻求开展针对性
便携式、可穿戴设备的快速发展,柔性超级电容器因体积小,充电时间短、功率密度高、循环稳定性强、绿色友好等优点备受青睐。石墨烯具有优异的电/热导率、柔韧性和稳定性,聚苯
国防通信巡线车主要执行通信光缆的巡线和抢修两项重大任务,是实现通信高速、稳定、不间断的基础保障。城市地区的通信巡线车维护任务主要面临着实时性差、效率低、通信条件
高速城市化进程导致城市不透水下垫面的急剧增加,全球气候变暖使得极端气候频发形成城市热岛效应、雨岛效应,加上不完善的城市雨水排放系统,导致城市内涝灾害频发、水质恶化,
钢轨探伤小车是新一代铁路轨道探伤设备,具备沿线伤损自动识别功能。但其定位主要依赖里程计的航迹推算,存在累积误差且无法自动消除,需要人为校正;同时,探伤数据的存储也需
近年来,德国的被动式超低能耗建筑(以下简称被动房)技术在中国不断推广应用。目前在我国严寒地区仅有为数不多的被动式低能耗住宅,本文拟对该被动房入住率不同的3年供暖能耗