基于内容的数据碎片类型识别技术研究

被引量 : 0次 | 上传用户:youtodown1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何快速识别种类繁多的文件类型是计算机中的一个基本问题。在数字取证、数据恢复和逆向工程等领域常常会遇到数据碎片类型识别问题,但是传统的基于扩展名和魔数的识别方法往往因为相应的数据碎片元信息遭到损坏或丢失而失效。因此,数据碎片类型识别成为了当前这些领域中亟待解决的难点和热点问题。本文针对基于内容的数据碎片类型识别问题,特别是其关键技术——数据碎片的特征提取技术,进行了深入研究,主要工作如下。首先,提出了一种基于灰度图的数据碎片类型识别方法。该方法将一维数据碎片的字节信息转化为二维的字节矩阵,并将矩阵中的字节值看作灰度图像中的像素值;再利用计算机视觉领域中的GIST Descriptor图片描述方法来提取灰度图像的特征;然后在灰度图像的GIST Descriptor特征基础之上,借助经典的分类器对数据碎片进行分类识别。实验结果表明,该方法较之于以往的归一化压缩距离和NLP等方法在识别精度方面有一定程度的提高。其次,提出一种基于频域和1-gram的数据碎片类型识别方法。为了提高识别的精度,该方法先采用离散余弦变换将数据碎片信息转化到频域之后再提取出直流系数及少部分交流系数作为碎片在频域中的特征;再使用字节频率分布提取出数据碎片中1-gram分布特征;然后将这两种特征结合并在此基础之上,借助经典的分类器对数据碎片进行分类识别。实验结果表明,该方法较之于基于灰度图、归一化压缩距离和NLP等方法,识别精度提高了10%-20%。本文针对基于内容的数据碎片类型识别问题,特别是其关键技术——数据碎片的特征提取技术,进行了研究。提出了基于灰度图以及基于频域和1-gram的两种碎片类型识别方法,并对这两种方法进行实验验证。本文的研究成果有助于文件雕复以及未知类型数据碎片的逆向自动解析等研究。
其他文献
<正>"今天的义务教育,城市与乡村、优质学校与薄弱学校在硬件上的差距越来越小,但质量上的差距并没有本质的改变。"全国政协常委、民进中央副主席朱永新对此感到忧虑。优质教
我们没有技术精英傲气、听不得意见的性格,我们承认自己的无知,愿意不断向师兄、客户、圈里人请教为人处事的道理。
8月22日~26日,全省高校主要领导干部学习贯彻省委十届六次全会暨省委工作会议精神研讨班在河南大学和焦裕禄干部学院举办。在5天的时间里,研讨班紧扣中央精神和省委安排部署,
姿态信息是飞行控制中最关键的参数之一。针对飞行控制系统首要解决的姿态测量问题。本文利用多微机电系统(MEMS)传感器与GPS组合,研制了一种微型航向姿态测量系统。考虑在以
随着沿海经济的发展,风暴潮灾害是我国沿海地区面临最主要的自然灾害之一,严重阻碍了经济的可持续发展,而巨灾债券作为一种非传统巨灾风险对冲工具可有效转移巨灾风险。本文
地方政府和各类学校正在为促进义务教育优质均衡发展不懈努力,通过加大投入,努力让义务教育学校的硬件建设均衡起来;采取结对、捆绑、兼并、集团化等多种形式从软件上努力促
荀子说:“人无礼则不生,事无礼则不成,国无礼则不宁。”孔子说:“悠悠万事,唯此唯大。” 所谓“礼”,一方面是讲维系社会的一种秩序、标准,一套礼教、礼法。一方面是讲国与国之间、
报纸
含能化合物属于一类易燃易爆的危险化学物质,极易受到机械、热和静电等刺激而发生爆炸。传统的含能化合物合成、分离、提纯、细化和包覆等工艺采用本质安全性低的间断式反应
江苏在推动义务教育优质均衡发展还面临着六个方面的挑战,即软与硬、普与优、大与小、厚与薄、公与民、南与北的问题;要以标准化建设为抓手,以资源均衡配置为关键,以深化教育
人类社会上万年的历史一直都是伴随着,依赖着建筑走过来的。人类基本的建筑为我们提供了一个遮风避雨,供暖驱寒的栖息之所。建筑作为人类文明形态的一种形式,首先肯定和表征了人