基于自编码器和对抗生成学习的金融欺诈检测模型

来源 :南昌大学 | 被引量 : 0次 | 上传用户:skiau2548
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,金融欺诈风险不断升级,对金融行业的良性健康发展造成一定影响。金融数据存在样本类别不平衡问题,对使用机器学习进行金融欺诈检测带来极大的挑战,本文基于自编码器和对抗生成学习对金融欺诈检测问题开展研究,构建有效的检测模型。本文首先基于自编码器结合生成对抗网络提出金融欺诈检测模型AE-G,一种通过生成潜在“欺诈样本”来辅助模型训练以增强模型分类能力的混合模型。自编码器用于金融欺诈检测可以采用基于重构误差的异常检测方法,但受限于没有欺诈样本辅助训练,检测性能的提升受到制约。AE-G基于在隐空间中正常样本和欺诈样本的隐变量分布之间存在“互补”关系的假设,借助生成对抗网络生成“欺诈交易”辅助分类训练,AE-G包含一个改进的自编码器和一个改进的生成对抗网络,改进的自编码器对重构输出再次编码,对重构输出和隐变量均进行约束以提升隐含层特征的表征能力,将其作为生成对抗网络的原始输入,改进的生成对抗网络的生成器旨在生成在隐空间中与原始输入位置“互补”的变量,基于前提假设,生成变量被作为“欺诈样本”与原始输入一起输入判别器,判别器用作分类器以区分两类样本,训练完成后,AE-G可以有效检测真实的欺诈样本。进而,本文提出基于变分自编码器的优化模型VAE-G,对AE-G前提假设和网络结构进一步优化,VAE-G利用变分自编码器的生成能力实现潜在“欺诈样本”的生成,基于在隐空间中正常交易先验分布近似标准高斯分布,而欺诈交易先验分布是与之不同但存在一定交集的另一高斯分布的前提假设,VAE-G中高斯分布转换器通过正常样本采样变量合成与之分布不同但相近的采样变量,作为“欺诈样本”的隐变量,将两种变量输入解码器生成两类样本,添加新的损失函数使解码器试图区分两类生成样本,进而与高斯转换器形成对抗关系。在解码器之后添加判别器用作分类。本文提出的两种检测模型都试图生成“欺诈样本”辅助分类训练以提升模型的检测能力,两者基于自编码器和变分自编码器的网络特点,采取了不同的“欺诈样本”生成方法,VAE-G是对AE-G模型进一步的优化。在对比实验中,本文提出的两种检测模型均表现出良好的性能,一定程度优于其他对比模型,VAE-G模型检测性能相较AE-G模型得到更大的提升,验证了本文提出的模型的有效性,为解决金融欺诈问题提供了新的思路,具有一定的价值。
其他文献
新冠疫情爆发,大量关于疫情发展的新闻报道和新闻漫画涌现。其中,以医生群体为主题的新闻漫画居多。媒介和公众都将视线聚焦到医护人员群体,他们的工作状态、一言一行受到了广泛的关注。本文也聚焦医生群体,将中国新闻漫画网的新闻漫画作为样本,进行研究。该网站是国内中国日报网旗下子网站,属于行业类权威网站。本文结合多模态隐喻理论和费尔克劳夫话语分析的三维模式,探究新闻漫画中的医生群体呈现了何种媒介形象,并分析医
学位
社交媒体已成为宗族宗亲活动的主要平台。以传统宗族关系为纽带的这一特殊群体和组织,在新兴社交媒体上如何重建和维系特定关系?这是本文的主要研究问题。为此,本文以江西省于都县“于都黄氏宗亲群”为研究对象,采用虚拟民族志以及深度访谈法来收集一手实证资料,试图对其进行初步探索。研究发现,网络突破了传统宗亲交往的空间限制,宗亲组织得以虚拟重建。社交媒体成为宗亲开展活动、传承集体记忆以及传播宗族文化的主要平台,
学位
近年来,随着互联网技术对于人们生活的渗透,研究者们对深度神经网络技术的不断探索,深度神经网络技术目前在图像识别、语音识别、机器翻译和自然语言处理等多个领域可以运用的范围不断扩展,其提供的解决效果和人工处理的结果越来越贴近。而最近几年,伴随着人们在计算机视觉领域的探索和学习不断深入,人们对于图像处理的水平越来越高,图像处理技术的应用范围也逐渐扩大,在人们生活和工作中应用面也是越来越广。近年来利用深度
学位
近年来,由于美国频繁对中国集成电路产业进行制裁,国家和企业越发意识到技术自主的重要性,因此也更加重视我国集成电路产业的发展和建设。但是我国该领域与国际先进水平相差较大,为了能实现技术追赶甚至反超,创新显得尤为重要。而对相关技术专利数据挖掘研究能为有效创新提供一定的指导意义。使用传统方式进行专利数据挖掘存在着效率低、正确率低、挖掘不深入和数据维度单一的问题,为了提出一种能够自动挖掘大量专利数据信息的
学位
可压缩黏性辐射反应气体方程组是由可压缩Navier-Stokes方程组耦合一个反应扩散方程所构成,描述了黏性辐射反应气体在高温状态下的运动规律。该模型的大初值强解的整体存在性以及大时间渐进行为的研究一直是近年来国内外所密切关注的热点问题之一。然而,对于更一般的热传导系数为温度的幂函数的情况,有待进一步研究。本文主要研究对于热传导系数为温度的幂函数的情形,一维全空间可压缩黏性辐射反应气体方程组强解的
学位
众所周知,随着国际互联网的快速发展,尤其是移动互联的兴起,用户行为数据所产生的价值也愈加提高,所产生的用户数据不论是种类还是数量也是越来越多,用户的这些行为数据是具有巨大价值的,推荐系统便在这个大环境下应运而生,它会结合用户的信息、物品的信息以及用户过去对物品的偏好,利用推荐算法合理地构建用户兴趣模型,为用户提供更为行之有效的个性化推荐服务。传统的音乐推荐大多数只关心音乐的显性属性,诸如作词人、作
学位
健康稳定的金融市场是国家经济平稳发展的基石,非法集资活动将会扰乱金融秩序,破坏经济的正常发展,给参与者带来较大经济损失的同时,还易威胁社会稳定,滋生治安问题。对民间集资进行约束,引导其规范发展,保证资金安全成为经济发展的首要任务。伴随大数据技术的升级,机器学习方法不断创新,深度学习理论有了更好地发展,越来越多的监管部门、企业合作伙伴、投资者开始重视企业生产经营过程中所产生的企业基本信息、纳税、企业
学位
近年来,随着深度学习在大数据时代的迅猛发展,人脸检测技术作为通用目标检测算法中的一种典型应用,受到越来越多工程领域和学术界的青睐。虽然人们通过改进网络结构,数据增强,设计新的损失函数等改进方法能够在一定程度上提升模型的性能,然而在针对多尺度人脸,小人脸,模糊人脸,以及遮挡性人脸的检测任务时,人们仍然缺乏有效的手段来完成实时的、高精度的检测,故而在已有模型上探索小人脸的检测方案仍然存在巨大的探索空间
学位
此学位论文主要研究了带有界变时滞和马氏链的非自治随机神经网络的p(p≥2)阶矩输入状态稳定性、p(p≥2)阶矩积分输入状态稳定性和几乎必然指数输入状态稳定性。为了克服有界变时滞存在带来的困难,建立时滞积分不等式,利用Lyapunov函数和随机分析理论,研究了此随机网络的输入状态稳定性。具体地讲,此学位论文分为以下几个部分:第一章,介绍本文的研究背景、研究意义和研究问题以及一些预备知识。第二章,当存
学位
近年来,内容垂直化、精细化已经成为短视频市场的重要发展趋势。作为短视频市场热门细分领域之一,美食类短视频领域涌现出大量优秀的创作人才,来自云南的创作者“滇西小哥”就位列其中。从创作策略和视听元素两个方面来看,主打云南美食的系列化创作、偏向纪录片的风格特征和人情味浓厚的创作策略奠定了“滇西小哥”以传达云南美食文化为主的视频风格。她用流畅质朴的镜头叙事、相得益彰的色调和光影、同期声与配乐和谐交织的视听
期刊