论文部分内容阅读
提升网络安全技能水平是网络安全专业人才培养的关键目标,个性化网络安全技能训练是实现该目标的重要途径。现有的训练科目推荐方案以用户偏好为目标,不适用于以提升技能水平为目标的网络安全技能训练场景。目前常见的网络安全技能训练主要依赖于教师进行能力评估和训练科目推荐,存在成本高、效益低的问题。针对上述问题,本文从技能水平评估入手,建立训练数据序列与技能水平序列之间的映射关系,提出了一套个性化训练科目推荐方案。首先根据训练数据序列评估学生的网络安全技能水平,然后根据技能水平的相似性精简原始训练数据序列集合,最后对精简训练数据序列集合进行序列模式挖掘,推荐训练科目。本文研究内容主要包括:1.针对现有技能水平评估算法忽略训练数据序列短时相关性的问题,提出了一种基于阶跃函数的技能水平评估算法。通过实验发现并验证了现有技能水平评估算法在量化技能水平时忽略了训练数据序列的短时相关性,造成了较大的评估误差;为此,本文定义技能水平序列动态刻画学生技能水平,引入阶跃函数提取训练数据序列的短时相关信息,提出了一种基于阶跃函数的技能水平评估算法,实现了训练数据序列向技能水平序列的映射。实验表明,与现有算法相比,基于阶跃函数的技能水平评估算法将评估的平均误差降低了11.73%,最大误差降低了16.25%。2.针对现有技能水平序列的相似性度量算法度量精度低问题,提出了一种双阶段的技能水平序列相似性度量框架。现有的技能水平序列相似性度量算法忽视数据形态,存在高假阳率的问题。针对该问题,提出了一种双阶段的技能水平序列相似性度量框架,包括粗化阶段和细化阶段,粗化阶段通过局部敏感哈希操作过滤非相似序列从而缩减度量空间,细化阶段引入数据形态对序列相似性进行度量,实现了技能水平序列向训练科目序列的逆映射。实验表明,相对于现有算法,双阶段的技能水平序列相似性度量框架将相似性度量的平均精度提高了16.34%,最高精度提高了20%。3.针对现有训练科目序列模式挖掘算法计算时间长的问题,提出了一种基于频度分布的训练科目序列模式挖掘算法(F-prefixSpan算法)。现有序列模式挖掘算法计算复杂度高,实时性差。针对该问题,本文提出的F-prefixSpan算法利用训练科目的频度分布对训练科目序列树进行快速剪枝,降低投影数据库的生成数量,实现了训练科目最优序列的快速挖掘。实验表明,相比于prefixSpan算法,F-prefixSpan算法的运行时间降低了6.2%。4.设计并实现了一套基于网络安全技能水平评估的训练科目推荐系统,并采用系统可用性量表(SUS)方法对系统可用性进行评估。实验结果表明,本文设计的系统的SUS评分达到了73.625分,从而说明系统有助于提升网络安全技能水平。