【摘 要】
:
数据库作为数据存储和管理的重要手段,在各行各业得到了越来越广泛的应用,数据库取证自然也成为了数字取证领域的研究热点之一,其中恢复已删除的数据更是数据库取证的重要组
论文部分内容阅读
数据库作为数据存储和管理的重要手段,在各行各业得到了越来越广泛的应用,数据库取证自然也成为了数字取证领域的研究热点之一,其中恢复已删除的数据更是数据库取证的重要组成部分。目前,数据库取证领域主要关注关系型数据库的研究,而鲜有涉及非关系型数据库。本文以HBase数据库为研究对象,对如何有效、完整地恢复HBase记录展开研究。主要工作如下:首先,根据HDFS的存储特征,提出了一种利用HDFS中存储的校验和文件来恢复HBase记录的方法。该方法先利用校验和文件来识别HBase数据文件的分片,从磁盘镜像里恢复数据文件的各个数据块,然后根据数据块的结构和记录的格式从已恢复的数据块里抽取相应的表记录。对三种簇大小的磁盘进行实验,实验结果表明,所提出的方法,对于簇大小为4KB和2KB的磁盘,记录的恢复率接近于100%,对于簇大小为1KB的磁盘,最低的恢复率也达到了83.61%。其次,根据预写日志的存储结构特征,提出了一种基于预写日志的恢复HBase记录的方法。在分析了预写日志结构的基础上,利用同步标识来识别日志文件的分片,然后利用序列号将各个分片进行排序,从而重构出日志文件,接着对日志条目格式进行分析,以恢复其中的表记录。同样对三种簇大小的磁盘进行实验,实验结果表明,在日志未被覆写的情况下,针对簇大小为4KB和2KB的磁盘,该方法能够恢复出日志文件中所有的记录,针对簇大小为1KB的磁盘,恢复率为96.22%,当日志文件被部分覆写时,也可以对未被覆写的部分实现最大程度的恢复。本文对HBase数据库的数据恢复技术进行了研究,研究成果对HBase数据库取证领域进一步研究具有一定的贡献。
其他文献
随着Web2.0技术和信息传播技术的飞速发展,我们已从信息匮乏的时代过渡到了信息过载的时代。个性化推荐技术作为解决信息过载的有效方法受到研究人员的广泛关注,其中,协同过
随着区域卫生信息化建设脚步的加快,建设一个可复制、可推广、可扩展、可提升的实用共享的区域性医疗卫生信息平台的任务愈发迫切。该平台的一个重要功能是使不同的医疗机构、
脑电信号处理作为脑机接口的基础,在神经科学、医学、生理学等研究领域发挥着重要的作用,关于脑电信号处理方法的研究已经成为脑机接口研究的一个重要课题。目前常见的脑电信
近年来,低压电力载波通信技术作为数据通信技术被深入研究和推广,并在自动抄表、智能家居、家庭接入网络技术方面得到广泛的应用。由于电力线最初是为传输能量而设计的,所以在传
随着多媒体技术的发展,视频逐渐深入到我们日常生活、工作以及学习中,起到了十分重要的作用,给我们带来了许多便利。与此同时,有关视频的盗版和内容篡改的案例也在增加,因此
无线传感器网络(Wireless Sensor Networks,WSNs)被认为是21世纪最有影响力和最有发展前景的21项技术以及未来改变世界的10大技术之一,它以其体积小、自组织、简单方便的特点被广
数字图像具有数据冗余大、表达信息丰富的特点,传统加密算法并没有针对这些特点进行设计,无法安全高效的完成图像加密任务,因此设计结合图像特点的加密算法是有必要的。另一
粗糙集(Rough Sets)理论是波兰学者Pawlak教授提出的一种处理不精确,不确定数据的有效工具。经过30多年的发展,粗糙集理论已广泛的应用于知识表示、数据挖掘、机器学习、模式识别
随着嵌入式操作系统的广泛应用和不断发展,特别是嵌入式设备与网络结合的应用范围日益广泛,嵌入式系统网络应用程序的安全性问题愈发凸显,已成为目前急需解决的问题。VxWorks操
互联网和Web承载着丰富的跨时空信息,为社会和商务的发展提供了动态、开放和便捷的环境。然而在虚拟化的网络中,与不相识的人进行交易,如何保证交易可靠、安全,以及确保服务质量