基于异构图神经网络的欺诈检测研究

来源 :华东交通大学 | 被引量 : 0次 | 上传用户:frjazz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息通讯技术与数字科技的进步,尤其是4G的发展以及5G的出现创造了一个高度交互的世界,从而建立了一个庞大的数字社会,这使人类的沟通方式变得更加简单,同时也大大提高了效率。然而,出于恶意竞争或巨大商业利益驱动,互联网也出现了大量的欺诈行为,如评论欺诈,金融欺诈和互联网广告欺诈等。由于欺诈行为本身具有良好的伪装性,不易辨认,加之网络上的信息量不断增加,使得通过人工检测欺诈行为困难大,成本高,且准确率不理想。因此,互联网领域迫切需要一些科学高效的检测方法来检测这些欺诈行为。最近,图神经网络已广泛应用于欺诈检测任务。图神经网络首先对不同关系下的相邻信息进行聚合,生成节点嵌入,然后利用最终的节点嵌入检测节点的可疑性。然而,传统的基于单一类型邻域聚合器的图神经网络无法从多个角度获取相邻信息,并且对不同的关系一视同仁,这不可避免地削弱了异构图的语义信息,同时,采用传统的拼接或平均操作来更新中心节点,这限制了图神经网络的表达能力。为了解决这些问题,本文提出了一种基于多邻域聚合器的异构图欺诈检测模型来执行欺诈检测任务。另外,欺诈者往往通过伪装的方式与良性实体连接到一起,这种欺诈伪装行为会严重损害模型的性能。本文又进一步设计了基于可训练邻居采样器的欺诈伪装行为检测模型。本文的主要研究内容和创新工作包括:(1)提出了基于多邻域聚合器的异构图欺诈检测模型(MAFD)现有的基于图神经网络的欺诈检测方法大多只使用单一类型的邻域聚合器来聚合邻域信息,导致模型只能捕获邻居信息的某个方面,并且在图神经网络的更新阶段使用传统的平均或拼接方式限制了图神经网络的表达能力。因此,本文提出了基于多邻域聚合器的异构图欺诈检测模型。具体来说,采用多种类型的邻域聚合器来聚合邻居信息,并利用聚合器级注意力学习不同聚合器的重要性。同时,使用关系级注意力学习各关系的权重。另外,传统的更新操作被向量的隐式和显式特征交互取代。在AMAZON和YELP两个数据集上的实验结果表明该模型有效地提高了欺诈检测的准确度。(2)提出了基于可训练邻居采样器的欺诈伪装行为检测模型(TNS)欺诈者往往通过伪装的方式与良性实体连接到一起,这种欺诈伪装行为将会严重影响到欺诈检测模型的性能。尽管大多数现有的基于图神经网络的欺诈检测工作能够取得不错的效果,但绝大部分工作忽略了欺诈者的伪装行为。因此,本文提出了基于可训练邻居采样器的欺诈伪装行为检测模型。该模型设计了可训练的邻居采样器来识别和过滤伪装的欺诈者。在AMAZON和YELP两个数据集上的实验结果显示该方法有效地识别和过滤了伪装的欺诈者,提高了欺诈检测的准确度。
其他文献
随着物联网、人工智能等信息技术的发展,数据的数量和维度呈几何式增长,数据的高维性降低了各种机器学习算法的运行效率并且影响分类器的分类性能。特征选择作为数据预处理的有效方法之一,能够从数据中去除不相关和冗余的特征,以降低数据维度,提高数据的紧密度以及后续机器学习算法的性能。粗糙集理论作为粒计算的一种重要理论,已成为特征选择、知识发现和数据挖掘等领域的热点研究工作。现实应用中,数据的形式复杂多样。大部
学位
近年来城市化水平加剧,地下空间的开发使用逐渐增多;随着建筑地上围护结构的隔热保温日益加强,由地下建筑围护结构传热带来的建筑负荷就成为了建筑总能耗中越来越重要且不可被忽略的部分。因此,对地下结构与大地之间的热传递过程和特性进行更加透彻的分析和研究,并进一步研究地下建筑的负荷特性及能耗状况对于准确设计地下建筑负荷及空调系统至关重要。当前国内外文献和相关地下建筑设计规范中对地下建筑围护结构进行研究时,通
学位
随着我国社会经济的高速发展,中国已经超越美国成为世界第一能源消费国。在我国能源消费结构中,建筑运行能耗占了较大的比重。降低建筑运行能耗的途径之一就是进行建筑能源管理,即对建筑运行能耗进行监测分析,并对建筑设备系统进行优化控制。但是,建筑能源系统具有系统异构、设备众多、数据庞大、控制策略复杂的特点,如何对其有效管理是保障建筑节能减排成效的关键。物联网是新一代信息技术,应用物联网技术的建筑能源管理平台
学位
近年来随着深度学习方法的发展,视觉SLAM逐渐成为热门的研究方向。视觉SLAM能够从图像中获取更高维的信息并加以利用。对于机器人、自动驾驶等领域有着重要的意义。针对现有的视觉SLAM方法的不足,本文的主要研究内容包括:如何从图像中筛选出包含更多信息的高质量特征点,以及如何在引入语义分割的SLAM方法中考虑神经网络模型的不确定性,进而提高位姿估计的准确性。基于深度学习的视觉SLAM方法的不确定性主要
学位
近年来,随着传感器、通信等技术的发展,移动设备具备了越来越强的数据收集和计算能力,在这种背景下移动群智感知受到了广泛关注。不同于传统物联网使用专门部署的传感器收集数据,移动群智感知是将感知任务众包给持有智能移动设备的参与者,利用设备中的传感器完成感知数据收集。与传统的物联网相比,移动群智感知具备较低的感知成本低、灵活的感知方法、更大的感知范围和更加丰富的感知数据类型等优势。移动群智感知的正常运行依
学位
空调冷凝水作为大气水中的一种非常规免费水资源,蕴含着丰富的水量和冷量。当下我国水资源呈紧缺且分布不均状态,城乡建筑面积大幅增加,建筑运行能耗占比进一步增大;且随着工业和城镇化发展,人民生活水平提高,中央空调和城镇居民空调器使用量进一步加大。空调冷凝水作为空调使用过程中的副产物,其所蕴含的水量和冷量资源仍未高效利用,各地区对冷凝水的回收设计未设定相应标准,对其特性也未做详细探究。针对这一现象,本文对
学位
随着我国《国家“十三五”规划纲要》推进与实施,绿色发展越来越成为时代的主题。从能耗角度来讲采用节能潜力巨大的辐射-对流式空调,对缓解我国能源问题具有重大意义。文章通过位于寒冷气候区的山东省济南市搭建的辐射地板与风机盘管联合供冷实验台,对目前存在的关于辐射地板与风机盘管联合供冷系统的性能与控制进行研究。首先,我们自建了4 m×2.8 m×3 m大小的实验房间并完成了基于室外气象条件的联合供冷自动运行
学位
目的 探讨低钠透析联合高通量透析对尿毒症维持性血液透析并发顽固性高血压患者血压、心功能的影响。方法 选取尿毒症维持性血液透析并发顽固性高血压患者72例,按照随机数字表法分为三组,每组24例,A组给予低钠联合高通量透析,B组给予高通量透析,C组常规透析;比较三组总有效率和不良反应发生率;采用动态血压监测仪监测患者血压节律;用彩色多普勒超声仪检测心功能参数;采用化学发光法检测甲状旁腺激素(PTH);采
期刊
目的 探讨沙库巴曲/缬沙坦(SV)治疗维持性血液透析(MHD)高血压病人的疗效及安全性。方法 回顾性分析2020年1月至2021年9月徐州医科大学附属医院血液净化中心MHD合并高血压病人的病历资料,其中服用SV降压65例(观察组),服用缬沙坦降压65例(对照组)。对比治疗前、治疗1周、4周、12周透析前后血压情况,同时分析治疗前及治疗12周心脏彩超参数、血常规、血生化变化情况以及不良反应事件发生情
期刊
竹笋营养物质丰富,作为一种健康蔬菜在全世界被广泛食用。而新鲜竹笋含水率高,采摘后在短时间内容易褐变并发生木质化,鲜笋损失率居高不下。热风干燥由于其低成本、高产量等优点,为目前使用最为广泛的干燥方式,但竹笋热风干燥还存在时间久、干制品质量较差等问题,因此,研究竹笋的热风干燥工艺具有十分重要的意义。本文以竹笋切片为研究对象,利用自行设计的热风干燥实验台,采用单因素实验方法,分别研究了热风温度、热风风速
学位