【摘 要】
:
随着信用卡业务及互联网技术的迅速发展,信用卡业务涉及的数据信息复杂化、支付途径多元化,与此同时欺诈交易数量逐渐增长,欺诈手段日益更新,不断呈现高科技、集团化、专业化、规模化趋势,金融机构每年都面临巨大的经济损失。除了国家政府颁布的相关法律去保障金融机构的利益,金融机构建立内部的大型数据库管理系统也是必不可少的,而信用卡欺诈行为检测技术也就成了构建管理系统的重中之重,这样才能更好地维护企业自身的权益
论文部分内容阅读
随着信用卡业务及互联网技术的迅速发展,信用卡业务涉及的数据信息复杂化、支付途径多元化,与此同时欺诈交易数量逐渐增长,欺诈手段日益更新,不断呈现高科技、集团化、专业化、规模化趋势,金融机构每年都面临巨大的经济损失。除了国家政府颁布的相关法律去保障金融机构的利益,金融机构建立内部的大型数据库管理系统也是必不可少的,而信用卡欺诈行为检测技术也就成了构建管理系统的重中之重,这样才能更好地维护企业自身的权益。本文根据Kaggle平台2018年最新公开发布的信用卡欺诈检测数据集,首先通过对数据集进行归一化处理、使用SMOTE算法进行不平衡处理、根据特征的概率分布图(PDF)及基于随机森林下的重要特征排序筛选特征;然后,选用了传统模型(逻辑回归LR、随机森林RF)、Boosting模型(Ada Boost、XGBoost、Light GBM)和LR-RF-XGBoost的集成投票模型对数据集进行训练,经过参数调整和优化后,根据评估指标(精确度、召回率、F1值、AUC值以及ROC曲线图)对比评价六类模型的预测结果。实例分析结果表明,基于集成学习构建的信用卡欺诈行为检测的评估模型(LR-RF-XGBoost投票模型),不仅提升了信用卡交易检测的准确度,很好地解决了过拟合、预测结果不稳定的问题,而且较好地提升了分类器的泛化能力。
其他文献
选址问题一直是当前社会中常见的热点问题,比如:广告气球的投放,公共设施安置以及实体销售网点选择,这类问题时时刻刻出现在实际生活中。随着,GPS技术在移动设备上的广泛应用,可以获取到不同设备用户大量的位置信息。选址问题的初衷便是更好的服务大众或者吸引大众的注意力。在这些地理位置信息的基础上,再进行选址问题的分析,会使得到的结果更具有参考价值。在本文中,主要研究并提出一个基于移动轨迹的Top-k最大影
日益复杂的战场电磁环境和未知的目标特性给雷达信号处理带来了更多的挑战。传统的雷达信号处理是基于模型的,主要利用模型的先验信息及相关信号处理准则设计信号处理方法,它使用了高斯的、线性的和平稳的假设。深度学习方法是一种基于数据的方法,它可以直接获得输入与输出之间的关系,本文研究如何在雷达信号处理中使用该方法。本文主要研究内容有:高斯和非高斯噪声条件下的确定性信号的神经网络检测器,对于运动目标的神经网络
当今世界已进入知识经济时代,专利规模的不断扩张,专利等知识产权受到人们前所未有的重视。专利不仅是企业技术实力的重要展现,更是企业参与竞争的战略性资源,是企业高价值的资产。目前专利文献的标引工作主要是请专业标引人员进行标引,在标引的过程中存在天然的缺陷,费时费力且主观性强,且在专利标引的过程中,只能对每件专利文献中的信息进行标引,标引的内容极少,专利知识难以掌握并合理利用,并且标引的内容并不能直观、
伴随着我国国内经济的发展,人们对生活品质的提高给予了更多关注,我国各项社会服务和基础建设也在不断完善,但经济发展方式出现了一些弊端,在教育、医疗、就业等民生领域积累了许多问题。因此保障并改善我国民生状况显得尤为重要。目前,我国的经济发展从过去阶段的高速增长转变为现在阶段的高质量发展,“新常态”下经济增速逐渐变缓,过去注重民生财政支出的数量,现在应该注重民生财政支出的绩效并且持续不断的优化民生财政支
虚拟现实技术,英文缩写为VR,是20世纪开始发展起来的一项全新的实用技术。虽然VR技术有着广阔前景,但是作为一项高速发展的科学技术,其自身的问题也随之逐渐浮现了,例如显示画质差、运动响应延迟大、发热严重、耗电快、人机交互方式单一等用户体验问题,此外,高昂价位同样是制约其扩张的原因之一。因此,提高VR设备的用户体验和降低VR设备的制作成本,是迫切需要解决的问题。VR一体机是科技和市场发展的必然趋势,
目前,金融市场风起云涌。作为整个银行的利润中心,零售业务刺激银行业的增长作用也日益显著。基于新的信息技术环境下,商业银行零售业务无论是在利润空间,还是在资源利用率方面都发挥着十分重要的作用。因此,零售业务日益受到银行的重视。与此同时,面对金融机构的激励竞争,零售业务面临的机遇和挑战也在不断的升级。随着互联网金融的不断发展,为了能够保持自身强劲的竞争优势,国有银行需要重视零售业务并确立以零售业务为核
随着近年来教育体系的不断变革,英语考试对阅读材料时效性和内容多样性的要求逐步提高,如何科学指导学生对海量文本数据进行挑选,寻找到适合自己阅读能力的英文文本,提高英语阅读能力,具有很强的实际意义。然而,现有的英语分级系统或算法,分级特征很多都停留在浅层数据特征,对文本难度表征不够,导致文本分类分级精确度较差,同时还存在现有分级系统数据库静态,不能满足材料时效性的问题。因此,本文构建了基于语法知识的英