基于神经网络降维和支持向量机分类的高维异常检测

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:sharufeifen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异常检测(Anomaly Detection)是数据挖掘中的重要部分。大数据背景下,数据的维度成“爆炸式”增长,这对高维数据异常检测的需求量也急剧增加。深度神经网络(Deep Neural Networks,DNN)优秀的非线性降维特性可以进行数据降维,解决“维数灾难”问题。单分类支持向量机(One-Class Support Vector Machine,OCSVM)是目前解决异常数据检测问题的重要手段。高维数据下的异常检测已成为科学前沿研究的重点和热点话题。本文首先提出了高维背景下的异常检测问题,接着分析了目前解决高维异常检测的两种有效途径,即利用神经网络降维和支持向量机分类。然后对以上两种传统方法做出了改进并与原方法在实验上进行了对比。实验结果表明,本文提出的改进算法在降低维度的同时提高了异常检测的正确率并且降低了算法的计算复杂度。本文的改进算法有以下两种:1.针对目前高维数据异常检测存在的困难,本文提出用降噪自动编码器(Denosing Auto-Encoder,DAE)代替普通的栈式自动编码器(Stacked Auto-Encoder,SAE)进行高维数据的异常检测。DAE首先对原始数据随机混入一定比例的噪声,然后将带有噪声的数据通过“编码”进行降维,再通过“解码”得到噪声数据的重构值,然后最小化原始无噪声数据与有噪声数据的重构值间的重构误差。实验证明,对于高维异常检测,降噪自动编码器的性能优于栈式自动编码器。同时与传统的OCSVM算法相比,降噪自编码器很好的解决了高维下的异常检测问题。2.本文将深度信念网络(Deep Belief Networks,DBN)和OCSVM进行组合,提出一种基于DBN和线性OCSVM混合模型算法进行高维异常检测。处于势能最低点的受限玻尔兹曼机堆叠而成的DBN网络具有良好的特征提取功能,降维后的数据再利用线性OCSVM进行异常检测。该算法最大的特点是经过DBN降维后的数据,无论使用线性函数或径向基函数作为核函数测试,OCSVM都有同样高的识别率。在提高高维异常检测识别率的同时,线性核函数的使用降低了算法的计算复杂度。该算法全面优于主成成分分析(Principle Component Analysis,PCA)与OCSVM构成的组合算法。同时,与自动编码器算法相比,该算法效率更高,其训练和测试时间均有显著下降。本文利用AE以及DBN与OCSVM的组合算法选用UCI数据集进行高维异常检测,并与传统的异常检测算法进行对比。实验考虑以下几个方面:1.SVM核函数的选取。实验分别采用线性函数和径向基函数作为OCSVM的核函数进行实验。2.DNN的隐藏层层数。探究在隐藏层层数不同时,对实验结果产生的影响。3.算法的效率。即在相同精确度下,训练时间和测试时间较少的算法最优。
其他文献
<正>要准确理解机关后勤服务社会化的含义,既遵循市场规律又遵循公益性规律,既发挥市场配置资源的决定性作用,又更好发挥机关事务管理部门的有效作用。习近平总书记在中央军
近年来由升温和氮沉降引起的全球气候变化对陆地生态系统的结构和功能造成极大影响,全球气候的变化会对森林生态系统的结构、物种、生产力以及森林类型分布等产生影响。苔藓植
本文首先通过对一般多项式的系统回顾,给出了对一般多项式的概念、性质及其应用的总结.主要内容包括:一般多项式插值的定义;一般多项式的各种类型的插值及其公式和数值积分公式.
"一带一路"的提出推动了陕西地区经济全面发展。融资是影响中小企业发展的重要因素,陕西地区中小企业要实现自身的发展就要看准这一契机,搭乘"一带一路"顺风车。利用好陕西"
目的评价导管接触性溶栓在下肢深静脉血栓形成并发肺动脉栓塞的临床应用价值方法选取我院血管外科在2014.09~2016.09收治的189例下肢深静脉血栓形成(DVT)患者,其中80例并发肺
以运输成本为基础建立了若干配送中心的选址模型,同时在模型的计算求解过程中考虑了配送中心运营可变成本。利用运输问题的表上作业法求解了模型中的线性函数部分,利用启发式
目的:本实验拟研发一类基于CD44核酸适配体、核仁素核酸适配体和DNA四面体的双靶向DNA纳米载药系统,并将阿霉素药物分子以嵌插结合的方式装载于DNA四面体上。然后,在体外细胞水平进一步评价上述构建的双靶向载药系统对黑色素瘤A375细胞的靶向性和有效性。方法:(1)PCR构建DNA纳米载药复合体;(2)将上述PCR构建的载药复合体与阿霉素共孵育,构建装载阿霉素药物分子的载药复合体;(3)血清稳定性
当前我国校园足球事业正处于快速发展阶段,校园足球比赛受到了社会各界广泛的关注,作为校园足球赛事的执法者和管理者,校园足球裁判员需要具备什么样的能力和素质才能更好地为校园足球事业的发展服务成为本次研究重点。胜任特征理论是管理学和心理学方面应用较为广泛的一个理论,它主要被应用于公共管理和人力资源开发领域。本文通过文献资料法和行为事件访谈法提炼出我国中、小学校园足球裁判员应具备的胜任特征要素并将这些特征
鄂尔多斯高新区成立于2011年,经过六年的不懈努力,于2017年2月经国务院批复升级为国家高新区,实行现行的国家高新技术产业开发区的政策,成为鄂尔多斯市第一家、自治区第三家国家高新区。作为全国最年轻的国家级高新区,鄂尔多斯高新区承载着鄂尔多斯市推动经济结构调整优化、促进产业转型升级、实现经济高质量发展的重任。但受全球经济增速放缓,自身发展基础比较薄弱,区域同质化竞争激烈等、自身发展受到资源环境约束
随着经济的发展和社会的进步,银行金融服务机构也取得了全面发展,当前银行金融服务机构也面临着严峻的市场竞争形势,加强基层国库监管,切实发挥基层国库职能,是当前摆在有关