论文部分内容阅读
近年来,随着数据量的急剧增长,云计算,大数据等技术应运而生,越来越多的人偏向于用云服务来处理数据。分布式文件系统作为云计算、大数据及其他现代系统的底层基础设施,为存储大容量、多样化数据信息提供了有效的方法。然而,云存储等服务也有可能为一些不法分子所利用,如通过云服务来存储、处理及隐藏犯罪和非法材料。虽然云服务提供商一直在努力防止他们的服务被利用,但是收效甚微,所以如何从分布式文件系统中提取完整、可靠的证据信息以证明访问行为成为一个迫切需要解决的问题。数字取证作为当下提取证据的有效方式,在处理云服务案件中有着不可或缺的重要性。然而,现在无论是学术界还是工业界,对云服务数字取证的研究大都集中在云计算的软件即服务(SaaS)层,对其基础设施即服务(IaaS)层如分布式文件系统级别的数字取证研究甚少。基于此问题,本课题以开源的分布式文件系统MooseFS为研究案例,提出面向分布式文件系统的数字取证研究。本文的主要研究内容如下:1、分析了MooseFS的系统架构,对MooseFS的安全机制进行了详细分析,并由此提出了对分布式文件系统进行数字取证的关键技术。2、设计了MooseFS的取证系统,本文根据当下广泛使用的云取证框架提出了适用于分布式文件系统的取证模型,并提出了取证系统的总体架构以及取证体系结构,对各功能模块进行了说明。3、研究了Aho–Corasick多模式匹配算法,本文将系统中所有数据服务器上存储的数据块文件名整合存储到一个文本文件中,再以该文本文件为模式匹配对象,以目标文件的数据块名为模式串集合,利用AC多模式匹配算法从文本文件中提取出与目标文件数据块相关联的数据服务器,从而实现了目标文件所在数据服务器的定位。4、研究了MooseFS系统证据提取的方法,主要是对主服务器和数据服务器上的关键文件进行了深入的研究,从而设计了对MooseFS系统的各个组件进行取证的分模块流程。进一步地,通过分析主服务器与数据服务器之间的关联,进而设计了对MooseFS系统进行取证的整体流程。结合流程设计了从MooseFS提取证据信息的仿真实验,并以清晰的步骤展示了从MooseFS中提取出关键数据块信息的具体方法。5、研究了取证数据文件安全性分析验证方法,本文分别利用数字签名和哈希算法对已收集的数据块文件进行合法性和完整性验证,并通过仿真实验验证所提取的文件是否满足合法性和完整性要求,是否能够作为证据文件,最终表明了本文开发的基于分布式文件系统的数字取证达到了安全取证设计要求。