论文部分内容阅读
根据语音特征实现说话人性别的自动识别,在音频处理与分析中具有重要的应用意义。为了克服语音常规线性参数在刻画说话人性别特征上的不足,本文使用了分形维等非线性参数作为特征空间的有效补偿。首先利用提升算法实现基音周期的提取;然后提取语音的分形维数;最后根据Takens定理,对分形维进行了重构,采用求近似熵的方法得到分形维复杂度。将基音周期、分形维数以及分形维复杂度构成三维向量,进行说话人的性别识别。实验证明,通过非线性参数的介入,与仅使用基音周期等传统线性特征的识别方法相比,识别系统的准确率和稳定性得到有