基于深度学习的聚类与异常检测研究

被引量 : 0次 | 上传用户:redsouler
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类与异常检测作为经典的数据分析算法被广泛地应用在数据挖掘领域。异常检测可以当作聚类的预处理方法,聚类可以视为异常检测的中间步骤,两者互为补充、相辅相成。然而,传统的聚类与异常检测算法依赖于人工提取数据特征。在处理复杂多样的数据时需要耗费大量人力进行数据预处理。随着深度学习在特征工程领域的不断发展,基于深度学习的聚类与异常检测算法受到广泛的关注。本文围绕基于深度学习的聚类与异常检测算法中存在的问题开展研究,旨在为数据的挖掘与管理提供有效的数据分析方法。主要贡献如下:(1)深度图聚类。首先,针对现有算法在提取图特征时忽略节点特征,且无法获得簇结构信息的问题,本文提出基于图神经网络的深度图聚类。该算法构建图神经网络考虑图中的节点特征和拓扑结构,根据图核与伪标签信息发现图之间的相似关系,从而提升图聚类效果。其次,针对图神经网络提取标量图特征,无法充分考虑图属性信息的问题,本文设计图聚类胶囊神经网络捕获向量化图特征。通过迭代优化策略更新胶囊网络参数与簇分配参数,增强了网络的表征能力。(2)深度多模态聚类。现有算法先学习数据特征再对特征进行聚类,学到的数据特征并不是适用于聚类任务的特征。此外,现有算法的网络结构无法满足聚类的约束条件。针对以上问题,本文提出基于端到端模式的深度多模态聚类。通过调整解码器结构,并且最小化重构数据与原始数据之间的距离,使模型直接输出聚类结果。引入多模特征融合模块,缩小融合特征与不同模态特征之间的差距,充分学习模态间的一致性信息,有效地改善了聚类结果。(3)深度异常检测。首先,针对基于推断的算法采用对抗训练约束目标方程无法捕获正常数据簇状结构,忽略正常数据边缘分布的问题,本文提出基于辅助任务与对抗训练的异常检测。通过分类正常数据与辅助数据学习正常数据的簇状结构,构建深度对抗训练模型捕获正常数据的边缘分布信息。其次,针对基于单分类器的算法采用单分类约束目标方程丢失文本内容信息,并且标量注意力权重无法关注单词维度属性的问题,本文提出基于注意力机制的文本异常检测。通过设计注意力机制与对抗训练方式捕获文本语义信息,构建维度转换矩阵提取多义词维度属性,提升了文本异常检测的效果。
其他文献
为了得到桶基础承受风、浪动荷载的承载性能,结合我国东海地质条件,统计中国东海2010—2020年浅、深海风速和最大海浪数据,通过计算得到风浪荷载并制成ABAQUS软件幅值曲线施加到海上风电吸力桶基础上,分析了吸力桶基础在动荷载作用下的承载特性。结果表明:吸力桶基础受风、浪荷载影响明显,桶基础迎力面受到风浪动荷载产生拉拔现象。在浅海区,桶基础在风浪荷载作用下桶身自上而下变形不协调,风浪荷载最大的10
期刊
近年来,随着经济的快速发展,我国金融市场改革持续深化,人民理财观念不断增强,银行理财产品随之而生。银行理财业务稳步上升的趋势,给我国的经济发展带来了新的动力。但与此同时,信贷传导机制作为我国货币政策传导机制的重要组成部分,其通畅性也因为银行理财产品的出现而受到影响。因此,探究理财产品对我国货币政策信贷传导的影响,对提高我国货币政策信贷传导的有效性具有重要现实意义。本文首先介绍了理财产品与货币政策信
学位
创新是推动发展的主要力量,是一个民族进步的灵魂。当前,我国正积极营造有利于大众创业、万众创新的良好氛围,鼓励企业特别是是中小企业开展创新研发。资金是企业进行创新的重要保障,没有资金、企业如同失去了生存的活力,生产经营都难以为继,更何况进行创新。在我国以银行为主导的间接融资体系下,从银行获取资金进行研发已经成为企业创新的重要手段。商业银行作为资本市场中的“卖方”,具有议价权,而中小企业由于信息的相对
学位
我国的宏观经济形势呈现出三期叠加的特点。面对经济进入新常态,我国政府采取各类经济政策组合来应对经济新常态。而在经济政策具体实践过程中,重大公共事件突发、金融改革和开放等多重冲击同样会加剧经济政策的不确定性。截至2021年末,非金融企业部门杠杆率为154.8%,位列三大部门杠杆率之首,成为宏观杠杆调控的重中之重。研究表明,经济政策不确定性会加剧企业部门杠杆的结构性分化。因此,正确认识经济政策不确定性
学位
由于农业生产的脆弱性,当风险来临时,农户仅靠自身条件无法抵御风险带来的损失,农业保险分散了农户的风险,降低了农户的损失,对于农业生产者来说是必不可少的保障。2004年,中央出台文件,点明了农业保险在支农中的重要地位。2019年5月,中央下发了《关于加快农业保险高质量发展的指导意见》(以下简称《指导意见》)的通知,标志着农业保险发展将由“量”转向“质”。山西省响应中央的指导,在同年出台了《加快政策性
学位
期货市场是现货市场发展到了特定阶段后的必然性产物,同时期货市场的经济力量也在驱动着现货市场前进,而期货的价格发现功能是现货市场的晴雨表,能够更有效的助力现货市场价格逐步趋向合理,同时期货市场的套期保值功能也能协助现货企业避免因价格波动而造成的巨大经济损失,有助于产业规模的不断扩大和产业的持续性发展。从山西省铝产业发展的角度来看,拥有丰富的铝资源和铝企业,但是在发展过程当中不平衡不充分矛盾凸显,能源
学位
随着银行存贷利率的市场化,从融资利率考虑银行融资流动性时,融资流动性对银行贷款风险的影响具有更多不确定性。此外,在研究融资流动性对银行贷款风险影响时缺乏对银行贷款风险的评估,本文基于信用评级估算银行贷款风险时,结合实际将贷款违约损失率视为具有双峰U型分布特征的变量。为了捕捉因变量非正态分布特征,运用分位数回归法分析了以融资利率表示的融资流动性对银行贷款风险的影响。研究结果发现:(1)虽然均值回归结
学位
在经济加速转型升级的背景下,中央政府持续加强对绿色金融政策的实施力度,国内各家商业银行都在逐步推进绿色信贷项目。2020年,我国首次提出碳达峰、碳中和发展战略目标,绿色经济成为发展共识,这意味着经济结构以及能源战略的重大转型升级。绿色信贷不仅是一项国家政策,另外也是一项近些年兴起的商业银行业务模式,对促进生态、社会和经济的可持续发展具有重要意义。我国商业银行处于激烈竞争的国际环境中,并肩负股东利益
学位
目的 探讨预防老年吞咽功能障碍患者误吸的护理对策及临床效果。方法 选取2020年9月至2022年3月江苏省邳州市人民医院神经内科收治的78例老年吞咽功能障碍患者为研究对象,将其以不同护理方式分为对照组(n=39)和观察组(n=39),对照组采用常规护理,观察组采用预防误吸护理,比较两组误吸发生率、护理效果、吞咽功能情况、生活质量。结果 观察组误吸发生率低于对照组,差异有统计学意义(P <0.05)
期刊
随着我国城市化进程加快,越来越多的专业人士参与到城市规划建设中。一个成功的选址不仅能够满足建设项目的自身需求,更能为城市增添几分色彩。建设项目选址需要考量诸多因素,如经济成本、交通网络及环境影响等,因此需要多领域的专家从多方面对选址方案进行评价。专家们现有的评价方法多数是使用实数进行评分,但在一些情况下,各领域的专家可能对其他领域并不了解,给出的评分会带有一定的犹豫性和模糊性。综合以上情况,本文提
学位