论文部分内容阅读
                            
                            
                                伴随着互联网与日俱新的快速发展,用户在享受着互联网提供的便捷服务的同时,也面临着各种各样的安全威胁。在赛门铁克公布的互联网安全威胁白皮书中,top6中第二位是数据泄露,第三位是身份盗用,而数据泄露常常会引发用户的账号密码信息泄露,导致攻击者利用用户的账号密码信息冒充用户,从而形成身份盗用。最直接的身份盗用引发的后果就是攻击者会通过伪造用户身份,来进行银行开户,贷款,盗刷信用卡等。截止2013年底,我国74.1%的网民曾遇到过信息安全问题,其中个人信息泄露和账号或密码被盗发生的比例分别13.4%和8.9%。
目前被大众认可的最普遍的一种身份认证方式为基于账号密码的认证,但这种基于用户账号密码的认证方式存在着易泄露、易遗忘等诸多问题。另一种是基于用户的物理令牌代替账号密码的认证,例如手机动态口令,智能卡等,但很明显,此种方式不仅增加了成本,同时还容易丢失令牌。
由于用户生物特征具有稳定性、唯一性、很难复制等特性,近几年来,越来越多的学者在做基于用户生物特征的身份认证的研究,例如虹膜认证、人脸认证、指纹认证、声纹认证等,人脸认证与指纹认证已经有了大量的应用,然而,基于这些生物特征的身份认证系统往往需要部署高额的设备,这便引出了学者们对一种更便捷,更容易普及的身份认证方式—基于击键行为的身份认证的研究。
击键行为的身份认证是一种通过分析用户敲击键盘的行为特征来区分用户的身份认证方案,其算法也常常被称为击键异常检测算法。基于击键行为的身份认证,学者们已经做了大量的研究同时提出了很多异常检测算法。这些研究基本分为两类,一类是对固定文本的研究,例如用户输入账号密码时的击键特征,另一类是对自由文本的研究,例如用户自由输入一篇文章时的击键特征。基于固定文本击键特征的研究主要针对用户输入账号密码登陆时认证,基于自由文本击键特征的研究主要针对用户进入系统后的持续性认证。在主流的基于击键行为的身份认证系统中,基于固定文本击键特征的认证方案由于其高准确率、用户友好性而成为主流方案。
然而,大多数的基于固定文本击键特征的异常检测算法在训练模型时需要大量样本,同时在用户身份认证时需要对比其他用户的样本(负样本)。考虑到将基于击键特征的身份认证落地于生产环境中,例如,在一个基于账号密码登陆系统中,我们使用用户在注册阶段输入密码时的击键特征作为训练样本,用户在登陆阶段输入的密码作为测试样本,很显然,存在两个问题,一是用户在注册时输入密码的次数不能太多,这便导致用大量的训练样本训练模型的情况是不现实的。另外在系统首次启动时,该用户作为系统的第一个使用者,不可能存在着其他用户的样本,这就导致了利用其他用户的样本进行对比从而认证用户的情况是不存在的。上述的两个问题便是本文提出的基于击键行为的身份认证系统中的身份认证系统冷启动问题,换句话来说,在基于击键行为身份认证系统中,当系统在最初启动时,在用户输入账号密码后,因为系统对于该用户的正负样本数极少,系统不足以训练出一个良好的身份认证模型,从而无法认证该用户。
本文立足于目前的身份认证方案,同时考虑到将基于击键行为的身份认证落地于生产环境中,分析并论述了国内外的研究现状,从而提出创新点:改进的基于击键行为的身份认证方案。首次提出了基于固定文本击键特征身份认证的冷启动问题,然后改进Z-Score异常检测算法使其应用于基于固定文本击键特征的身份认证方案中来解决冷启动问题,同时本文所提出的Z-Score异常检测器具有极高的稳定性,该异常检测器检测结果的EER无论样本量大小如何变化,其值都非常稳定,最后提出一种解决了冷启动问题并可以落地于生产环境中的基于击键行为的身份认证解决方案。
本文实现并比较了目前常见的基于固定文本击键特征身份认证的异常检测算法的性能,提出了基于固定文本击键特征的身份认证冷启动问题,并通过Z-Score异常检测算法给出并解决了冷启动问题,该算法达到了平均EER为0.1135、平均AUC为0.9340的良好效果,并且EER与AUC并不随着样本量大小的变化而变化,具有极高的稳定性。最后提出一种解决了冷启动问题并可以落地于生产环境中的基于击键行为的身份认证解决方案,该方案在认证系统冷启动阶段运用改进的Z-Score异常检测算法,正常认证阶段使用SVDD单分类器进行认证。
                        目前被大众认可的最普遍的一种身份认证方式为基于账号密码的认证,但这种基于用户账号密码的认证方式存在着易泄露、易遗忘等诸多问题。另一种是基于用户的物理令牌代替账号密码的认证,例如手机动态口令,智能卡等,但很明显,此种方式不仅增加了成本,同时还容易丢失令牌。
由于用户生物特征具有稳定性、唯一性、很难复制等特性,近几年来,越来越多的学者在做基于用户生物特征的身份认证的研究,例如虹膜认证、人脸认证、指纹认证、声纹认证等,人脸认证与指纹认证已经有了大量的应用,然而,基于这些生物特征的身份认证系统往往需要部署高额的设备,这便引出了学者们对一种更便捷,更容易普及的身份认证方式—基于击键行为的身份认证的研究。
击键行为的身份认证是一种通过分析用户敲击键盘的行为特征来区分用户的身份认证方案,其算法也常常被称为击键异常检测算法。基于击键行为的身份认证,学者们已经做了大量的研究同时提出了很多异常检测算法。这些研究基本分为两类,一类是对固定文本的研究,例如用户输入账号密码时的击键特征,另一类是对自由文本的研究,例如用户自由输入一篇文章时的击键特征。基于固定文本击键特征的研究主要针对用户输入账号密码登陆时认证,基于自由文本击键特征的研究主要针对用户进入系统后的持续性认证。在主流的基于击键行为的身份认证系统中,基于固定文本击键特征的认证方案由于其高准确率、用户友好性而成为主流方案。
然而,大多数的基于固定文本击键特征的异常检测算法在训练模型时需要大量样本,同时在用户身份认证时需要对比其他用户的样本(负样本)。考虑到将基于击键特征的身份认证落地于生产环境中,例如,在一个基于账号密码登陆系统中,我们使用用户在注册阶段输入密码时的击键特征作为训练样本,用户在登陆阶段输入的密码作为测试样本,很显然,存在两个问题,一是用户在注册时输入密码的次数不能太多,这便导致用大量的训练样本训练模型的情况是不现实的。另外在系统首次启动时,该用户作为系统的第一个使用者,不可能存在着其他用户的样本,这就导致了利用其他用户的样本进行对比从而认证用户的情况是不存在的。上述的两个问题便是本文提出的基于击键行为的身份认证系统中的身份认证系统冷启动问题,换句话来说,在基于击键行为身份认证系统中,当系统在最初启动时,在用户输入账号密码后,因为系统对于该用户的正负样本数极少,系统不足以训练出一个良好的身份认证模型,从而无法认证该用户。
本文立足于目前的身份认证方案,同时考虑到将基于击键行为的身份认证落地于生产环境中,分析并论述了国内外的研究现状,从而提出创新点:改进的基于击键行为的身份认证方案。首次提出了基于固定文本击键特征身份认证的冷启动问题,然后改进Z-Score异常检测算法使其应用于基于固定文本击键特征的身份认证方案中来解决冷启动问题,同时本文所提出的Z-Score异常检测器具有极高的稳定性,该异常检测器检测结果的EER无论样本量大小如何变化,其值都非常稳定,最后提出一种解决了冷启动问题并可以落地于生产环境中的基于击键行为的身份认证解决方案。
本文实现并比较了目前常见的基于固定文本击键特征身份认证的异常检测算法的性能,提出了基于固定文本击键特征的身份认证冷启动问题,并通过Z-Score异常检测算法给出并解决了冷启动问题,该算法达到了平均EER为0.1135、平均AUC为0.9340的良好效果,并且EER与AUC并不随着样本量大小的变化而变化,具有极高的稳定性。最后提出一种解决了冷启动问题并可以落地于生产环境中的基于击键行为的身份认证解决方案,该方案在认证系统冷启动阶段运用改进的Z-Score异常检测算法,正常认证阶段使用SVDD单分类器进行认证。