论文部分内容阅读
为满足信息化办公的需求,近年来,数码复印机功能不断增强。在企事业单位,数码复印机在为人们的工作和生活带来便利的同时,也暴露出一些安全隐患,如敏感信息的泄露、用户对于数码复印机的越权使用以及对于数码复印机的恶意操作等。为了加强对数码复印机的监管,保障信息安全,企事业单位迫切需要在定期进行的安全检查中加入对数码复印机的审计工作。因此,如何合理有效地对数码复印机进行审计也成为了亟待解决的问题。在此背景下,市场中主要出现了三种对于数码复印机审计的解决方案:集成审计功能的安全增强型数码复印机、基于打印协议的打印内容监控系统和基于数码复印机硬盘内容恢复的取证系统。但以上方案存在审计成本高、审计对象不够完整、对行为审计不足的问题。基于上述分析,本文从内容审计和行为审计两个角度出发,以留底图片、日志和配置项这三种数据为审计对象,实现了一个数码复印机内容安全审计系统,具体工作包含以下四点:(1)在审计对象的获取方面,从数码复印机的WEB子系统入手,提取了多个主流品牌数码复印机在获取留底图片、日志和配置项时所需的请求参数和URL,并在此基础上设计了一种基于网络爬虫技术的数码复印机内容自动获取方案,通过该方案,可以支持和兼容多品牌、多子型号数码复印机审计对象的获取,解决了原始审计对象分布位置分散、不利于审计的问题。(2)在内容审计方面,本文首先将留底图片进行文字识别,之后在识别基础上进行敏感词检测。然而,留底图片格式多样,部分格式(如MMR格式)无法通过光学字符识别工具进行识别,为此本文提出了一种MMR格式图片解析算法,将MMR格式转换成TIFF格式,解决了原始图片的识别问题。(3)在行为审计方面,本文基于数码复印机日志分别进行操作事件审计和用户行为审计。在操作事件审计过程中,我们首先对数码复印机原始日志进行分析,将原始日志中代表一次完整操作事件的多条日志进行组合,生成事件日志序列,之后,提取每一个事件日志序列的关键特征,并通过凝聚层次聚类算法求取事件序列中的离群点,将其作为可疑事件上报给审计人员。在用户行为审计过程中,我们通过一种改进的Apriori算法,对聚类后日志序列中的用户特征、时间特征和事件类别特征进行关联分析挖掘,建立用户行为模型,与正常模型无法匹配的用户行为将被作为异常行为上报。该方案能够有效弥补现有方案中对于行为审计的缺失。(4)基于以上工作,本文以模块化的方式实现了数码复印机内容安全审计系统。实践证明,系统支持七大品牌下的百余款子型号数码复印机,能够从内容和行为两方面满足企事业单位对数码复印机的审计需求。