论文部分内容阅读
随着现代语音处理技术的飞速发展,大量功能强大的音频编辑软件不断涌现,人们可以容易的编辑出想要的音频而在听觉上无法轻易分辨,使得音频证据的真实性取证越来越受到广泛关注。独立的录音证据必须满足三个要素:真实性、合法性和关联性。其中真实性是合法性和关联性的基础和录音证据的首要条件。本文针对以篡改检测为核心内容的录音证据的真实性取证和以录音设备识别为核心内容的来源性取证进行了研究,同时为了更好地进行判决,对以语音增强为主要内容的录音证据的改善性取证进行了研究。本文主要创新性工作如下:(1)针对目前尚未有专门的录音设备特征参数,本文提出了时域低值比重粗糙度等三个录音设备特征参数;根据录音设备频响特性,改进了MFCC滤波器组,提出了修正的MFCC倒谱参数;并将各种特征参数相结合构成了116维的混合特征参数;针对设备特征和说话人特征并存对设备识别和说话人识别系统性能影响的问题,基于设备特征子空间和说话人特征子空间不满足正交的条件,提出了一种录音设备特征和说话人特征的斜投影子空间跟踪方法,实验分析表明,通过11个不同品牌型号的录音设备和60个青年男女,每人10句不同语音,显示混合特征参数能够有效地表征录音设备的特征,其识别率比普通的倒谱参数提高了10.4%左右;针对混合特征采用斜投影子空间跟踪方法能够较大幅度地提高录音设备识别系统的识别率,从74.4%提高到95.9%以上。(2)针对音频证据中存在电网频率特征成分情况,提出了一种基于线性完整变换的高精度电网频率测量方法,实验结果表明,该方法在给出的多种噪声环境下达到了98.8%精度。能够较好地应用于录音证据的真实性取证研究中,该算法也能够有效地表征录音地点特征。针对音频证据中不存在电网频率特征成分情况,在分数倒谱域上将噪声与音频进行分离,并利用联合特征参数进行录音证据的真实性检测,着重分析了拼接对噪声特征的影响,提出了基于分数倒谱变换的拼接帧联合特征检测算法。实验结果表明,分数倒谱变换的分数域联合特征参数明显优于Malik等人提出的滑动窗内差分能量参数。无噪声环境下篡改处检出率达到92%,非平稳噪声下能达到84.3%的正确识别率。(3)实际的录音证据常受到录音环境和噪声的干扰,本文基于分数傅里叶变换的旋转特性提出了分数傅里叶变换域上幅度相位联合滤波的方法,理论分析和实验结果表明该模型能够进一步降低非平稳噪声的影响,其性能从波形和频谱上看要明显优于Hossain提出的修正幅度相位滤波法,能够更好地保留波形和频谱中的细节。