基于距离的孤立点挖掘在计算机取证中的应用研究

被引量 : 0次 | 上传用户:snake_icy1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,我们已经进入了大数据时期,每天产生各类形式各异的数据,与之相随的会出现各种网络安全问题,针对这些问题,当前的研究工作主要集中在安全防御方面,但是计算机网络犯罪技术也在不断进步,因此仅靠防御方法是不能很好地打击计算机犯罪的,我们需要发挥社会和法律的力量去打击计算机犯罪,计算机取证技术应运而生。数据挖掘技术可以从海量的数据中挖掘出潜在的、有研究价值的知识,但是从这些海量数据中找到那些极少数的异常行为并发现有意义的知识是一项富有挑战性的工作,然而现实生活中经常包含一些与数据集一般行为或者一般模型不一致的数据对象,即孤立点。虽然正常的行为比数异常行为要多得多,但不正常的行为可能含有非常有趣的知识。所以研究这些孤立点具有一定的理论基础和实践意义。本文对K近邻孤立点检测算法进行了更为细致的研究,进而对其进行了改进,提高了算法的效率及准确性。同时针对网络操作日志数据量大、计算量大的特点,本文采用基于MapReduce架构的分布式算法思想,在Hadoop集群中快速的检测孤立点。对国内和国际的相关异常检测方法的研究和应用进行了详细分析,设计了基于孤立点挖掘的异常检测模型,最后将孤立点检测方法应用于计算机取证技术中。本文主要研究如下:(1)系统探讨了当前国内外孤立点挖掘算法的研究现状,分析了孤立点挖掘算法的应用实例,理论学习了孤立点挖掘算法的概念、流程,并对孤立点挖掘算法的性能和实现机制进行了总结。深入研究计算机取证的相关知识与技能,总结了计算机取证的关键技术,并给出计算机取证的流程。(2)深入研究基于距离的反向K近邻孤立点检测算法,并指出其不足,并对算法进行了改进,通过剪枝操作去除冗余数据后,加入了自适应确定参数的机制,避免了过多人工参与造成的数据偏离,提高了算法的准确性和高效性。在Hadoop集群架构中设计了基于MapReduce的孤立点检测算法,在分布式环境中快速检测孤立点。(3)构造一种基于孤立点挖掘算法的日志分析模型,对日志数据进行预处理后,将改进的孤立点检测算法应用到模型中,经实例证明,该模型可以有效的将算法中挖掘出的孤立点进行分析,能够得到初步证据,使得取证服务更加高效、智能。
其他文献
针对日前媒体曝光的多家酒店使用脏抹布、脏浴巾或脏海绵擦拭杯子、洗手台、镜面等问题,文化和旅游部15日回应表示高度重视,对涉事酒店进行了排查,立即责成上海、北京、福建、江
期刊
纺织工程作业全过程都存在张力控制的问题。文章分析了从前纺工序到织布、后处理整个工艺流程的物质形态,归纳了典型纺织作业方式下张力控制的特点,研究张力控制问题的不同性
作为岭南土著民族的壮族 ,在千百年的历史发展进程中 ,形成了具有民族个性的文化———女性文化 ,从女神创世到女英雄救世 ,女性在壮族社会中的文化地位一直是那么显赫 ,以至
生态伦理是人们在探讨解决生态危机的过程中提出的一种新的伦理观,它倡导大自然的权利与价值,要求人们将道德关怀的对象延伸到自然界的所有物种,从而实现人与自然的和谐。为了改
血液透析患者普遍存在睡眠障碍,发生率高达60%~80%,同时增加了心血管事件的发生率,与患者的生活质量及长期存活率相关,因此寻求改善睡眠质量的方法对提高血液透析患者的生存率
随着科学技术的发展,一系列问题接踵而至,迫使人们不得不对科学技术的社会功能重新思考。分析20世纪以来科学技术负面影响的原因,主要是科技制度的伦理缺失和科技制度本身的
在北京工作的刘女士,最近遇到了一件烦心事。她给公词员工预订去国外度假的机票和酒店时,为了尽量控制成本,没有去正规的旅游公司预订,而是选择了一家在线旅游网站,没想到这一订就
期刊
<正>在最近一次中考复习教研活动中,笔者有幸执教了一节"坐标系中三角尺滑动"的教学研讨课,得到与会老师的好评,本文呈现这次活动的教学流程和预设意图,与更多同行研讨交流.
日的:通过观察血流动力学指标和检测大鼠心肌抗氧化指标酶的药效学实验,了解辛热药物吴茱萸提取物吴茱萸水浸膏、吴茱萸醇浸膏和吴茱萸水煎液作为实验用药对缺血缺氧状态下心
善是人类精神的一个永恒的主题,是一个价值范畴。人们追求和谐是一种理想、一种善。从伦理道德的角度看,和谐反映了人们在人与人、人与社会、人与自然关系上的价值追求是和谐有