论文部分内容阅读
近几年,随着通讯技术及IT技术的不断发展,以智能手机为代表的智能移动信息设备因其携带方便、操作简单、功能强大等特点得到广泛应用。随之而来的安全问题也日益凸显,越来越多的犯罪分子开始利用智能终端从事犯罪活动。如何快速全面的获取智能移动信息设备中的有利证据,成为侦破案件的关键问题。目前,智能移动信息设备取证工具大多都是针对数据提取方面的,但对证据的分析方面还缺乏深入的研究。犯罪分子为了掩盖证据,通常使用敏感词的同义词来代替敏感词。而现有的取证设备大部分是精确匹配,从而遗漏关键信息,导致取证信息不全面,严重影响了取证工作的质量。本文针对证据搜索不够全面的问题提出了一种改进的文本分类算法,设计并实现了一套取证系统,使得证据的获取更加全面。论文的主要工作包括以下几个方面:第一,阐述了智能移动信息设备取证的相关技术及流程。对现有的取证工具做出分析,指出其在证据分析方面的不足之处。并对证据分析过程中用到的文本分类技术做出了介绍,针对证据分析技术方面的不足,提出改进文本分类技术来提高证据的查全率。第二,在对证据分类算法的研究中,针对文本分类过程中常见的特征词稀疏问题,提出了一种改进的基于同义词扩充的文本分类算法。该算法基于知网的架构关系对特征词进行了扩充,并计算同义词的相应权重,实验结果表明,改进的算法在一定程度上提高了文本分类的召回率和F1值。第三,设计并实现了一套智能移动信息设备取证系统。详细描述了数据提取以及证据搜索的过程,将改进的文本分类算法运用到数据分析模块,提高了证据获取的全面性。该系统采用可视化的方式将证据展现给取证人员,方便了取证工作的进行。证据分析环节是智能移动信息设备取证过程中的关键环节,基于本文改进的证据分析算法设计的取证系统,能够全面获取犯罪证据,对于打击与智能移动信息设备相关的各类犯罪活动、维护社会稳定具有重要意义。