机器学习模型在车险欺诈检测的研究进展

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:myth_liu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着保险行业的蓬勃发展,保险欺诈问题也显得日趋严重.车险欺诈一直是保险欺诈的“重灾区”,对保险行业的发展至关重要.因此,车险欺诈检测技术一直是国内外学者研究的热点问题.鉴于我国在机动车辆保险欺诈检测技术方相对滞后,而国外的研究成果又较少对我国车险业务数据进行有效建模与分析,首次针对机器学习模型应用在车险欺诈检测的研究工作进行了文献调研,对二十多年来的研究工作进行系统化的归纳与总结.通过引入车险欺诈流程的简介,对专家系统与智能理赔系统在车险欺诈检测的流程进行了叙述;依次从国外和国内的角度介绍了机器学习模型应用在车险欺诈检测的具体研究进展,并进行了宏观的对比;基于国内某车险公司提供近5年来高质量的车险数据选取具有代表性的机器学习模型进行建模,并进行了全面的测试与分析;探讨了车险欺诈检测技术未来的研究方向.
其他文献
网络靶场是用于网络空间安全研究,利用计算机仿真技术创建的高度近似于真实网络空间运行机制的可信、可控、可定制的重要基础设施.结合网络空间安全发展态势,归纳分析并重新定义了网络靶场的概念,提出了网络靶场的基本服务能力.立足体系结构、实现技术和功能需求等属性特征,选择目前具有代表性的典型网络靶场进行了分析.在此基础上,重点从大规模网络仿真、网络流量模拟及用户行为模拟等方面,讨论了网络靶场的关键技术.着重从技术和应用方面讨论了网络靶场的发展过程与趋势,并对我国网络靶场的现状与发展作了必要探讨.
近些年,老年人的健康问题越来越受到重视,跌倒作为影响老年人健康安全问题的主要原因之一,其研究热度一直居高不下,高质量的跌倒检测算法层出不穷.总结了跌倒检测的研究意义和现有的热门研究方法,分别从单一算法和混合算法的角度概述基于阈值、机器学习与深度学习三个方面的跌倒检测算法,介绍各算法的检测方式、判定方式、总体性能和各类单一算法的优缺点,并且从时间、空间和时空三重维度重点阐述了卷积神经网络在跌倒领域发挥的显著作用及应用;同时介绍了跌倒检测算法所使用的数据集及其特点,便于研究者了解跌倒检测在阈值、机器学习与深度
针对软件定义网络(software defined network,SDN)中控制器发生故障问题,提出了一种基于多种群粒子群算法的SDN控制器故障恢复策略.从其他正常工作的子控制器集合中挑选出能够容纳失控交换机负载的备份控制器集,将精英种群与子种群组成多种群粒子群,采用预选和交互机制演化出备份控制器的最优位置,以保证交换机与控制器之间的传播时延最小,完成失控交换机的迁移.实验结果表明,相比于现有的控制器故障恢复算法,该算法在恢复时间、控制器负载利用方面均有所提升.
针对社会化推荐算法中存在的推荐准确率不高的问题,提出了一种多头注意力门控神经网络(MAGN)算法.具体来说,采用门控神经网络对输入的用户和用户-朋友对进行融合得到联合嵌入,利用注意力记忆网络来获取不同朋友在不同方面对用户的影响,利用多头注意力来获取在不同方面对用户影响程度偏高的几位朋友.采用门控神经网络将朋友影响和用户自身兴趣偏好进行混合,继而基于混合兴趣偏好对项目进行推荐.在两个公开真实数据集上进行实验进一步验证了所提方法的有效性.
针对传统协同过滤推荐算法普遍存在的数据稀疏性问题以及寻找相似用户时存在局限性,提出一种融合狼群算法和模糊聚类的混合推荐算法.在数据处理过程中,根据基于项目的协同过滤算法充分挖掘项目间的数据关系,填充原始矩阵的零值以降低数据稀疏性;从用户的角度出发,根据模糊聚类隶属度的大小筛选出相关邻居集合,扩大相关用户的寻找范围;将狼群算法引入模糊聚类,借助狼群算法全局搜索的优势,提高寻找相似用户的准确度.在真实的数据集上进行对比实验,结果表明,所提算法缓解了数据稀疏的问题,推荐误差明显减小,和传统的推荐算法相比有着良好
为了解决信息过载问题,提出了一种融合知识图谱与注意力机制的推荐模型.在该模型中,将知识图谱作为辅助信息进行嵌入,可以缓解传统推荐算法数据稀疏和冷启动问题,并且给推荐结果带来可解释性.为了提升推荐准确率以及捕捉用户兴趣的动态变化,再结合深度学习中的神经网络以及注意力机制生成用户自适应表示,加上动态因子来更好地捕捉用户动态兴趣变化,使用多层感知机对项目进行评分预测.在MovieLens-latest-small电影数据集和豆瓣数据集进行仿真验证,结果表明该模型进行TOP-K列表电影推荐相比于其他算法拥有更好的
微博情感分析旨在挖掘网民对特定事件的观点和看法,是网络舆情监测的重要内容.目前的微博情感分析模型一般使用Word2Vector或GloVe等静态词向量方法,不能很好地解决一词多义问题;另外,使用的单一词语层Attention机制未能充分考虑文本层次结构的重要性,对句间关系捕获不足.针对这些问题,提出一种基于BERT和层次化Attention的模型BERT-HAN(bidirectional encoder representations from transformers-hierarchical Att
Keccak哈希函数是第三代安全哈希函数,具有可证明的安全性与良好的实现性能.讨论基于代数系统求解的4轮Keccak-256原像攻击,对已有的4轮原像攻击方法进行了完善,有效降低了理论复杂度.目前,4轮Keccak-256原像攻击的理论复杂度最低为2239,通过充分利用二次比特的因式之间的关系,在自由度相同的情况下,线性化更多的二次比特,将理论复杂度降低至2216.
映射域漂移和偏见性预测问题使得现有的方案无法很好地应对广义零样本学习挑战.在CADA-VAE模型的基础上,提出了基于模态融合的半监督学习方案,就如何利用未标注样本及语义辅助模型进行模态内自学习提供了一种思路.该方案使用潜层向量空间作为视觉和语义模态融合的桥梁,提出了视觉质心和异类语义潜层向量概念,用以指导模态间互学习;在交叉重构环节,以视觉质心为轴,将语义潜层向量交叉重构为此类的视觉特征;在特征编码环节,沿异类语义潜层向量的负方向将视觉特征编码为潜层向量;保证了生成的样本具有多样性的同时不失类间区分度.通
方面级别的情感分析(ABSA)旨在确定句子中特定目标的情感倾向.大部分现有方法仅使用语义层面信息,不能很好地利用不同方面词的意见术语来达到精确的情感分类,且模型不具有可解释性.语法层面信息中词性信息和以特定方面术语为根节点的句法结构依存树可以用于捕获句子中特定方面的意见术语.提出了结合词性信息且具有模型可解释性的BG-CNN,并引入依存树作为辅助信息用于细粒度文本情感分析.提出了增强损失函数用于模型的训练.在三个经典数据集上进行验证,实验结果表明了该模型和增强损失函数的有效性.