【摘 要】
:
为了使用户能够准确、高效地分析信用卡数据,信用评分的决策与预测已成为研究热点之一。信用卡数据是具有代表性的海量数据。随着信用卡相关领域的扩大,信用卡数据逐渐被各种高维数据所代表。因此,对于信用卡大数据市场来说,如何提供一个自动化的信用卡数据分析和集成环境,如何有效地转移和重新分配信用度已成为当务之急。本文主要研究了信用卡的数据建模问题,寻找影响信用卡的信用度好坏的因子,并根据多种数据分析算法的结果
论文部分内容阅读
为了使用户能够准确、高效地分析信用卡数据,信用评分的决策与预测已成为研究热点之一。信用卡数据是具有代表性的海量数据。随着信用卡相关领域的扩大,信用卡数据逐渐被各种高维数据所代表。因此,对于信用卡大数据市场来说,如何提供一个自动化的信用卡数据分析和集成环境,如何有效地转移和重新分配信用度已成为当务之急。本文主要研究了信用卡的数据建模问题,寻找影响信用卡的信用度好坏的因子,并根据多种数据分析算法的结果找出最优的方案。为了完成该任务,本文面向银行数据分析人员,基于R语言与Oracle数据库和SFTP之间的连接,用R语言实现了批量信用卡交易数据分析模型和电子图表的可视化显示系统。该系统后台是信用卡数据分析模型和R基础函数库,前台是基于JSON的E-Charts可视化展示平台,具体功能包括数据加载、信用卡数据分析模型调用、分析结果和日志的归档、E-Charts可视化展示等。论文的主要工作包括:1)对信用卡建模进行需求分析,用R语言与Oracle数据库、服务器(Windows和Unix)和E-Charts连接实现分析与展示功能,构建一个信用卡的批处理集成系统。2)构建R模型的批处理集成环境,将R算法包集成到wrap下并调用,实现逻辑回归、判别分析、决策树和随机森林等多个分析算法的批处理。3)对元数据进行ETL处理,在批量集成系统中使用多个分析算法得到分析结果和报表,并对分析结果进行比较,得出随机森林算法的结果总体上优于其它算法,可以为更深入地数据分析提供依据。综上所述,本文从基础财务数据出发,使用R语言构建R集成环境,自动处理数据挖掘算法模型,对大数据进行重组和调整,获得具有商业价值的客户管理和风险评估的数据分析和预测报告;同时,运用与电子海图相关的大数据可视化方法,将可视化分析结果形象地展现出来,使财务数据分析更加容易。上述两项成果已广泛应用于银行系统的数据开发和数据分析。
其他文献
近几年,随着移动互联网的发展,广告业务迎来了新的变革。为了吸引更多用户,在提升项目运营收益的同时,减少广告投放的成本,广告主们希望能够实时的分析广告投放数据和项目运营数据。因此设计出一款能够结合广告投放数据和项目运营数据的实时分析系统,就是当下各大广告主不可或缺的需求。本文的基于广告投放的实时运营数据分析系统就是为了满足广告主的需求而设计开发的。系统采用埋点自动化实时数仓的解决方案,保证数据能够被
随着国家战略下新能源车的研发制造与全面推广,结合国内互联网行业的高速发展,以往传统车企中汽车营销及服务系统所采用的单体架构,其冗长的需求到最终上线周期会耗费大量时间,在面对日渐复杂的需求业务以及不断增长的业务量现状,已经无法满足当下以及未来新能源车业务生态发展的需求。本论文针对上述问题基于Spring Cloud Alibaba微服务架构和Vue web框架实现了一套全新的新能源车数字化营销及服务
随着互联网的不断发展,云计算和大数据已经成为时代的热门技术,在数据存储、数据传输、访问控制等方面产生了更加复杂的安全需求。在传统的属性基加密中,属性均由一个可信的私钥生成中心管理,存在密钥托管问题;且当用户私钥发生泄漏时,无法有效锁定私钥泄露的恶意用户身份。在目前国内外研究中,多机构授权下的属性基加密方案能够有效缓解密钥托管、避免单一授权机构权限过大的问题。在可追踪属性基加密方面,白盒可追踪模型是
在数字金融化的不断发展和普及的时代,数据量随着业务的增加呈现爆发式的增长,分布式概念越来越普及,但由于大多数传统银行核心系统使用的仍然是集中式大型主机系统,在数据扩展、系统升级和数据安全上逐渐遇到瓶颈,因此由集中式系统迁移至分布式系统势在必行。对于大型银行系统迁移任务来说,应用服务迁移、分布式路由转发和数据库迁移是系统迁移中的重要任务,本文以应用服务迁移为重点,对服务转发前的路由规则重适配、服务重
随着汽车智能化、网络化的发展趋势,汽车通过车载终端接入了互联网,更多地和云端进行交互,并为汽车用户提供了丰富的车联网和娱乐服务。近年来,车辆的电子电气架构往分布式架构发展,车内控制器的数量也急剧增加,控制器软件的迭代日益频繁,为解决软件更新带来的运维和成本问题,提供用户更便捷快速的升级服务,FOTA(Firmware Over the Air,固件在线升级)成为汽车升级的重要方式。然而,FOTA升
多方数据联合学习可以取得较好的学习效果,但数据聚合带来了安全和隐私问题,很多研究方案将安全多方计算应用到纵向联邦学习中。现有的纵向联邦学习的研究方案都是基于数据公开共享,一种是明文数据共享,另一种是密文数据共享,但都带来了安全性和效率的问题,因此在保持足够模型精度的同时提升计算效率和安全性是联邦学习研究的一大挑战。为了解决这些问题,本文提出了一种基于安全多方计算的纵向联邦学习隐私保护方法。首先,本
为了调查广西地区犬细小病毒(CPV)的优势毒株及其遗传变异情况,试验利用PCR方法对采自广西地区的423份犬血清样本进行CPV检测并扩增其VP2基因,利用MegAlign软件进行同源性比对并分析VP2蛋白主要突变的氨基酸位点,同时利用MEGA 7.0软件采用邻接法构建遗传进化树。结果表明:共获得55份CPV阳性血清样本,阳性率约为13.0%。PCR扩增得到大小约为1 755 bp的VP2基因。55
随着医院放射科医疗信息化的发展,病人病例报告数据对于医院来说越来越重要。以往的病例报告数据都在放射科信息系统中,其中病例报告数据没有统一的模板管理,也没有疾病标签和关键征象词关联,医生书写和查阅起来非常麻烦。放射科在此基础上,提出了建设放射科病例报告信息系统的需求。针对这一问题,本课题设计并实现了病例报告系统,大大方便了医生书写和查阅病例报告,能够提供病例存储库和病例学习平台,为病例报告提供了系统
21世纪以来,互联网的迅猛发展推动了各行各业的进步。在教育行业,传统的线下教育已经很难满足人们的需要。城乡教育资源的不平衡不充分发展,导致城乡教育差距越拉越大。虽然市面上也有许多在线学习平台,但是质量参差不齐,比如学习资源繁杂,让用户无所适从;学习方式单一化,有的平台仅仅只能点播视频无法为用户量身打造、推荐出用户感兴趣的课程,用户体验性较差;平台所使用的技术架构为传统的单体架构,在复杂的用户场景下
近年来海事信息化建设高速发展,随着海事政务服务平台“海事一网通办”平台的投入使用,标志着海事系统数据融合进入新的阶段,但是包括“一网通办”在内的各种海事信息服务平台都采用高度集中的中心化部署方案,信息发展新阶段越来越要求各信息系统的数据共享与开放程度要适应航运的发展速度,另外随着国家对数据安全的重视,对涉及国家行业数据、个人隐私数据的保护也有着极高的要求。区块链拥有分布式存储、防篡改和加密机制,可