论文部分内容阅读
随着信息技术的发展,数据恢复技术作为打击高科技信息犯罪的有效手段得到越来越多的关注。文件雕复技术是一种不依赖于文件系统元信息的深度数据恢复技术,克服了传统数据恢复技术依赖于文件系统元信息的不足之处,从而成为计算机取证领域的研究热点。目前在市场上占有优势地位的Microsoft Word文件是一种重要的数字证据来源,因此开展针对Word文件雕复技术的研究是非常必要的。本文从深入综述现有文件雕复技术入手,分析了Word文件的内部结构和内容特征,提出了针对Word文件的雕复方法。主要完成了以下四点工作。首先,对现有的文件雕复技术进行了深入的剖析,阐明了各自的优越性和局限性,并总结了现有文件雕复技术所面临的挑战以及今后的发展方向。其次,针对Word2003文件提出了一种基于内部数据流的雕复方法。充分利用了Word2003文件特有的虚拟流特征来实现文件雕复。该雕复方法不仅能雕复连续的Word2003文件,在文件分片的情况下也具有比较好的效果。对比实验结果表明算法在雕复文件数目、准确率及召回率三者的综合表现上较其他雕复方法有明显优势。再次,提出了一种基于内部数据流的Word2003文件真实度验证方法。在研究文件的文件结构、内容特征还有存储特性的基础上,结合现有的计算机证据的法律法规和标准,提出了一种已恢复Word2003文件的真实度计算方法,实验验证了该方法具有一定的可行性。最后,针对Word2007文件提出了一种基于结构和内容的雕复方法。凭借Word2007文件的结构特点和内容特征,结合已有的雕复技术,提出了一个Word2007文件雕复方法。该方法可以雕复二分片、非关键部位数据损坏或丢失的word2007文件。在实际磁盘数据集上的对比实验表明本雕复算法与同类算法相比具有更好的准确性综上所述,本文提出了针对Word文件的雕复方法和真实度验证方法,并通过实验证明其可行性和有效性。研究成果期望为进一步发展文件雕复技术提供一种新的思路,也为实现更加实用的数据恢复系统打下基础。