论文部分内容阅读
传统的基于击键行为的身份认证技术主要基于时间特征对用户身份进行验证,但是时间特征种类过于单一,而且较易受到用户自身因素和外部因素的影响,稳定性较差,对用户行为模式的识别效果较差。针对上述问题,本文在特征的选用和分类算法的设计上进行了改进和创新,丰富了可提取特征的种类,增强了所选取特征的稳定性,提高了相对稳定的特征对分类结果的影响,从而优化了身份认证技术的识别效果,提高了检测准确率。同时,为了提高所设计身份认证技术的实用性,本文选择了基于自由文本的击键动力学身份认证方式。本文所做的研究工作及取得的成果如下:在击键行为特征提取方面,本文对非传统特征做了进一步的扩充和优化组合,提出了本文所使用的特征集。相对于传统的时间特征,该特征集丰富了所提取特征的种类。同时,该特征集包含的非传统特征均基于用户的较长文本输入进行提取,因而具有较好的稳定性,可以更为客观地对用户的行为特点进行反映。通过数据分析与相应的对比实验可以看出,本文所提取的非传统特征数据集相对于传统时间特征在SVM及DT分类算法测试下对用户身份的识别准确率均有一定程度的提升。在身份认证技术分类算法设计方面,本文基于传统的距离分类算法,设计了基于最小加权距离的单分类算法。该算法基于单分类模型进行设计,通过计算待测样本与训练集中样本的最小加权距离,与预设的阈值进行比较,从而对用户的身份进行判定,所谓的加权距离,即对各维度的距离计算均用原始的距离数值除以该维度特征的标准差,对其进行加权处理。该算法具有三点优势:首先,该算法基于单分类模型进行设计,与现实使用场景较为契合、训练数据采集难度较低;其次,该分类算法通过计算待检测用户与训练数据之间的最小距离对用户身份进行判定,可以对用户身份进行更好地分类;最后,也是该算法最关键的地方,该算法对距离计算做了加权处理,可以突出相对较为稳定的特征对距离计算结果的影响,从而增强其对最终分类结果的作用力度,更好地发挥相对稳定特征的数据优势,在一定程度上进一步解决了特征数据存在的不稳定问题,实验结果显示,本文设计的分类算法EER率降至10.24%,相对于该领域内的其他研究成果有了一定的改善。结合本文选取的非传统特征和设计的基于最小加权距离的单分类算法,本文设计实现了基于击键动力学的身份认证系统,将本文所做的研究工作有效结合到一起,测试结果显示该系统可在410ms内对用户的身份进行识别,且识别FAR以及FRR率分别降至10.75%和7.26%,系统运行占用最大内存仅为96.5M,具有较好的实用性,为击键动力学身份认证技术的普及应用提供了一定的借鉴作用。