【摘 要】
:
异常检测在医疗、金融等领域有着广泛的应用,其中尤以多元无监督数据的异常检测比一元数据更普遍存在,且更为复杂.本文从三种典型检测方法入手,针对一组多元无监督数据集进行了异常检测的实验.三种方法分别是基于统计的马氏距离、基于划分思想的孤立森林、以及基于深度学习的自编码器,它们代表了异常检测方法的三个大的领域.文章在同一个数据集使用这三种方法,探索和讨论了三种方法实验过程和实验结果的异同.
论文部分内容阅读
异常检测在医疗、金融等领域有着广泛的应用,其中尤以多元无监督数据的异常检测比一元数据更普遍存在,且更为复杂.本文从三种典型检测方法入手,针对一组多元无监督数据集进行了异常检测的实验.三种方法分别是基于统计的马氏距离、基于划分思想的孤立森林、以及基于深度学习的自编码器,它们代表了异常检测方法的三个大的领域.文章在同一个数据集使用这三种方法,探索和讨论了三种方法实验过程和实验结果的异同.
其他文献
挥发性有机物(VOCs)是形成臭氧的重要前体,分析VOCs排放特征及管控过程中存在的问题,从而提出针对有效的措施减少VOCs排放,对区域臭氧污染控制和大气环境治理具有重要意义.基于濮阳市第二次全国污染源普查数据,分析了濮阳市工业源VOCs排放特征及区域、行业分布特征,总结了濮阳市VOCs治理过程中存在的问题,从而针对性提出濮阳市VOCs污染管控建议,对指导濮阳市及京津冀周边城市大气污染治理具有一定的参考意义.
进入新世纪,信息系统集成作为业务系统的重要部分,在项目管理中越来越重要.基于此本文阐述了了项目管理和信息系统集成的定义优势并进行阶段性分析,同时也提出了优化信息系统集成的相关解决方案.
在开发过程中浅层稠油易发生地表窜漏,不仅会污染环境,而且会影响油田产量.若对所有窜漏相关井进行封堵,不仅封堵施工量大,而且会破坏储层物性,降低储层动用程度.为解决地表窜漏问题,油田开展了大量的现场试验,总结出地漏治理的技术路线为:先确定窜漏相关井,再综合电法监测结果、地质分析和生态动态数据分析确定窜漏通道,最后选择窜漏直接相关井和窜漏通道上的关键节点井进行封堵施工.应用结果表明:与直接对所有窜漏相关井封堵相比,该方法不仅可以消除地表窜漏,而且治理成本更低,可为解决类似地表窜漏提供借鉴.
背散射X射线人体安检图像通常存在信噪比低、对比度弱的特点,不利于安检员观察判读,并且,直接利用原始图像进行人体安全检查,涉及个人隐私问题.为此,研究了一种图像感兴趣边缘检测方法:首先,利用一种基于中值的自适应混合滤波方法降低图像噪声,然后,对滤波图像进行线性灰度拉伸提高其对比度,接着,利用一种多方向灰度形态学边缘检测方法提取图像边缘信息并进行边缘图像分割,最后,利用连通区标记过滤方法,保留图像中感兴趣边缘.试验结果表明,方法能够有效提取人体图像感兴趣边缘,在不影响检查人员观察判读基础上,最大限度地保护了被
为了响应智能电网关于数据治理的建设,进一步提升电网公司的数据质量,推动.从组织架构,制定规范制定,数据建模,数据采集,数据流转监控,问题跟踪管理,认责机制,数据质量评价体系等多维度全方面,从顶层而基层单位,从线上到线下覆盖整个数据生命周期,建立一套数据质量管理体系.经过总结归纳高频数据质量问题,提出整改方案,对高频及重点数据重点在线监控,保证企业内部数据质量,为数据向外延展打好基础.通过建立一套数据质量管理体系,直接提升企业数据的应用价值,为智能电网的建设提供支撑.
通过“1+X”证书制度的实施,实现了书证的衔接融通,可以提升双证书的质量.在本研究中,围绕Web前端开发职业技能等级证书,探讨了软件技术专业培养方案的改革,实现了课程体系的调整优化,从而提升了高职院校人才培养的质量.
随着航空公司间的激烈竞争,如何使客户与公司的关系进一步发展是航空公司目前面临的挑战,传统方法并不能够较好的解决该问题.通过采用K-Means算法进行建模,分析航空公司客户特征客户价值,将现有客户价值和潜在客户价值,通过分析发现不同特征的客户具有不同的客户价值.该研究表明,通过客户价值特征建模分析,可以为航空公司的发展提供决策依据,该技术不仅可以对客户价值进行分析也可以使其应用相关客户价值广泛应用.
随着互联网、计算机等现代信息化技术的迅速发展,数字资源这一新型资源应运而生,其涉及到电子图书、电子会议论文、电子期刊等.当前国铁集团工务基础设施检测监测领域的数据量呈现指数型增长,数字资源已在其经营发展中发挥着至关重要的作用.而元数据这一数据形式,可对数字资源的内容、特征、属性等信息进行揭示;制定元数据标准并建设元数据模型,完成数据标准管理和数据质量管理工作,实现国家铁路数字工务全域数据管控.要想有效提高数字资源的建设效果与服务质量,就需要确保数字资源元数据的质量.但因为数字资源元数据涉及范围很广,且存在
数字素养是数字时代生存和发展的基本条件,分析评价大学生数字素养,发现其问题和不足,并提出改进建议.以获取与识别数字信息的能力、数字交流与协作的能力、创建数字内容的能力、数字安全保护的能力、数字问题解决的能力五个维度构建大学生数字素养评价体系,并以吉林省高大学生为对象进行模糊综合评价.吉林省大学生数字素养水平整体较好,但获取新技术知识能力、分享信息能力和数据保护意识相对较弱,可以从增强信息安全意识、强化数字技术基本能力培养等方面加强学生数字素养教育.
乡镇雪亮工程前端监控点的数量大,分散且广分布的特点增加了业务收敛和传输线路复杂度,此外,数据量大增,中心管理平台压力增大.对传输网络架构及传输路由的选择提出更高要求,本文就乡镇雪亮工程综合考虑建设、维护及管理的方便性,以县、乡、村三级传输网络架构、采用“PTN+OTN”联合组网承载方案,对乡镇雪亮工程传输方案规划起到指导作用.