论文部分内容阅读
作为主流手机操作系统,Android在锁屏和开屏等方面采用传统的密码保护,焦点激活,手摇控制及图形解锁等,这类保护方式简便快捷,但不具有独特性,一旦被他人窃取就可通过认证获得手机使用权限,从而导致信息泄露。因此,本文提出基于声纹特征的认证模型,通过采集机主本人独一无二的声纹特征和由本人自定义的语义信息,构建一个具有双重保护机制的声纹密码锁,用于开机、休眠启动、私密文件保护以及应用软件的开启等可实现手机的授权使用,防止个人敏感数据泄露,提高手机的安全使用等级。论文对比分析了语音线性预测倒谱系数(LPCC)和Mel频率倒谱系数(MFCC)两种特征对误拒率(FRR)和误纳率(FAR)的影响,提取能反映说话人独特性的特征。考虑Android手机运算能力的局限性,并综合考虑声纹识别率和算法时间花费平衡,小样本条件下对比分析了动态时间规整(DTW)和矢量量化(VQ)应用于文本相关声纹识别效果。实验表明VQ在识别率90.5%时识别时间0.16s,比DTW快0.3s,且FRR和FAR均低于DTW。为提高算法在手机噪声应用环境的鲁棒性,对语音增强和端点检测方法进行了研究改进。针对传统小波去噪所采用硬阈值和软阈值函数的不足,提出一种改进阈值函数方法,并从时域及频域对比分析了新方法对噪声滤除效果;选择基于分形维数和能量融合的端点检测方法(Combined VoiceActivity Detection,CVAD),实验结果表明:在-5dB的背景环境下具有75%的端点检测准确率,在20dB以上的背景环境下准确率达到95%以上。论文实现一个应用于Android手机的声纹密码锁,声纹密码信息机主本人可随时更改,可避免密码泄露和录音回放等问题。实验表明在实验室环境可达到90%以上的识别率;正常手机应用背景噪声场合,未选择去噪和改进端点检测方法时,识别率仅有61%;选择改进小波阈值去噪和CVAD后,算法识别率提高到88.5%,FRR、FAR分别降低了17.5%和20%,有效增强声纹密码锁对环境的鲁棒性。此声纹密码锁能在所有的Android设备上安装运行,能根据不同版本的Android系统设备选择采样率进行语音录制和数据提取,并能随时更改密码信息防止密码泄露问题,且识别率和识别速度均在可接受的范围内。