【摘 要】
:
异常检测用来预处理数据,挖掘异类数据信息,是数据挖掘的一种重要方法。近年来由于维度灾难问题,高维异常数据检测显得十分困难,针对上述问题提出一种基于自编码器和集成学习
【基金项目】
:
国家自然科学基金(71871172,71571139)
论文部分内容阅读
异常检测用来预处理数据,挖掘异类数据信息,是数据挖掘的一种重要方法。近年来由于维度灾难问题,高维异常数据检测显得十分困难,针对上述问题提出一种基于自编码器和集成学习的半监督异常检测算法。首先利用自编码器降维,在编解码过程中异常数据的异常程度被增大,然后在AdaBoost提升框架中融合iforest、LOF、K-means算法,基于3种算法对于不同异常类型的敏感性,提升异常检测的准确性。选取UCI机器学习库中的高维异常数据集进行实验。实验结果表明,该模型的准确性相较于目前主流的异常检测算法有显著提升。
其他文献
今年中央经济工作会议像是系统论述当代中国经济学的专题讲座,全面阐述了中国经济在新常态下的趋势、特征和规律变化,如同转动的"经济魔方",对需求、供给、风险、调控等进行综
目的:分析原发性胃恶性淋巴瘤内镜下表现特征及其病理学特点。方法:我院PGML患者17例,患者均行电子胃镜检查,并行黏膜活检病理检查,同时行免疫组织化学染色检测和14碳呼吸试验。结
在新的课改理念下,如何吸引学生兴趣,如何教会学生学习,使学生养成对学科的持久兴趣和有目的、有耐力的学习态度,是每位教学者应该探究的问题,认识到教学的情绪、情感和认知
中国古典园林,特别是江南私家园林,往往具有托物言志、避世隐逸、游览鉴赏、陶冶情操的作用。本文从红楼梦的大观园谈起,研究文学园林的生活化场景,进而由虚拟到现实,以南浔
<正>一、问题的提出礼仪是社会文明进步的重要标志之一,虽然它更多地表现为外在的行为规范,但却在协调人际关系、维护民族尊严、促进世界和平、推动社会发展等方面,发挥了不
摘 要:本文认为将原来分散在全省各县区、农村供电所的核算工作集中后壓缩到25多人完成,给核算的及时性带来一定的困难,针对这个问题德州供电公司以“集约、智能、高效、专业”为目标,依托用电信息全采集的优势,采取了整合传统的抄表核算业务、优化抄表核算业务管理模式、实现智能化抄表核算业务应用、增强营销业务管控能力等措施,实现营销各专业的横向贯通,有效提升工作效率;推动了业务流程整合,提高优质服务水平;取得
目的:总结分析乳腺叶状瘤X线钼靶照片的影像学特征。方法:搜集2003年1月至2009年10月经手术、病理证实的11例乳腺叶状瘤,均行X线钼靶摄片,回顾性分析其临床特点及影像学征像。结
语义匹配问题是自然语言处理的核心问题之一。基于语义的匹配,即通过提取文本内在语义进行匹配度计算,是目前自然语言处理领域研究的热点。传统的语义匹配模型并没有结合语句
新冠状疫情发生后,湖北省旅游行业受疫情影响损失巨大,为促进湖北省旅游行业高质量振兴发展。本文通过电话访谈、问卷、联通手机信令数据、网络舆情数据等方式对湖北省文旅企
国务院第二次大督查,就是要把各项政策措施的执行情况、实际效果、困难障碍、企业和基层及群众的意见建议了解清楚。看看哪些政策到位了,哪些没有到位,哪些出现了"中梗阻"。遇