论文部分内容阅读
听觉科学是研究动物对声音感知的学科,它汇集了多个学科领域的研究者。本文试图从心理声学和信号处理的角度探索耳蜗感音机制及其应用。针对声码器模型和听觉滤波器模型中单个通道内的时域信息开展研究。重点关注人类耳蜗对听觉信号中的幅度调制信息(Amplitude Modulation,AM)的编码机制以及从听觉信号中提取幅度调制信息的信号处理方法。具体开展了四个方面的工作:正常听力者的正弦载波正弦幅度调制声刺激感知实验;人工耳蜗植入者的单电极正弦幅度调制电刺激感知实验;听觉信号中的幅度调制信息提取方法研究;幅度调制信息在人工听觉中的应用。 通过对22名年轻的正常听力者开展正弦载波正弦幅度调制声刺激感知实验,研究了不同频段的声刺激AM检测能力差异。实验方法为二选项强迫选择法和自适应调整步长的心理物理学方法。研究发现AM调制率和纯音载波频率均会对纯音载波的正弦幅度调制的检测能力产生影响;当载波频率位于中低频段(约2kHz以下)时,检测能力随调制率升高而增强,在高频段(3.5kHz左右以上)检测能力也会受到调制率的影响,但不呈现单调变化趋势;调制率在10-100Hz之间时,调制检测能力随载波频率的变化不显著;调制率在150Hz-300Hz之间时,调制检测能力随着载波频率上升而下降,但当载波频率在3.5kHz以上时,不再对调制检测能力产生显著影响。 通过对7名语后聋人工耳蜗植入者开展单电极正弦幅度调制电刺激感知实验,研究了耳蜗基底膜上不同电极位置处的电刺激AM检测能力和AM音高感知能力。AM检测能力实验采用二选项强迫选择法和自适应调整步长的心理物理学方法。发现在不同电极位置上AM检测能力存在显著差异,AM检测能力从蜗尖到蜗底逐渐减弱,在同一个电极位置上呈现随调制率升高而降低的低通趋势;某些植入者表现出了极强的AM检测能力,可以检测到1个电流单位的调制深度。AM音高感知实验中采用二选项强迫选择法和多次重复测量的心理物理方法。发现AM音高感知能力在蜗尖明显优于蜗中和蜗底的电极。AM音高在调制率50-200Hz间表现出较好的随调制率升高而升高的趋势;未调制信号更趋向于音高高于AM调制信号。分析发现AM检测能力和AM音高感知能力有强相关性。然而AM感知能力和言语识别间的相关性未被发现,有待专门设计和开展实验进行研究。 从信号处理理论的角度,证明了希尔伯特变换法为隐式的相干解调法,所得到的希尔伯特包络与同步检波法得到的AM信息在理论上是相等的。希尔伯特变化法与典型的非相干解调法(即RLF法)有本质上的差异。希尔伯特包络的优点在于对于任意信号具有唯一解,同时相比于RLF法存在AM波动快慢不可调控的缺点。基于经验模态分解理论研究的实验结果暗示希尔伯特变换法仅适用于窄带听觉信号的AM提取。 最后,在心理声学实验和信号处理理论分析基础上,提出了AM在人工听觉中的两个应用案例:自动乐器识别和人工耳蜗信号处理策略。发现仅利用16个频带的AM信息,对9种乐器音色的自动识别正确率可以达到85%以上。在一定范围内(2-16)分频带数的增加会增加AM中所携带的有效信息,使得乐器识别率得到显著提高。然而频带数目并非越大越好,例如32个频带的识别效果就比16频带要差。不同的AM信息提取方法对乐器识别效果也有显著影响。相比于全波整流加低通滤波的方法,基于解析信号的方法具有明显的优势。在整流加低通滤波的方法中,随着低通滤波截止频率的升高,识别效果有明显改善趋势。发现带通信号中的两个带限正交分量(BLQ)携带了丰富的信息,可以通过AM形式传送到听神经上去。提出了一种基于BLQ的人工耳蜗信号处理策略,其算法复杂度低,且从算法角度来看可以直接在目前的商用人工耳蜗硬件系统中实现。与经典策略CIS中的AM信息相比,BLQ具有优良的低频带限特性,可能让人工耳蜗植入者感受到更多的声音信息。但是BLQ策略对人工耳蜗植入者的实际效果还有待进一步开展实验研究。 总之,听觉信号中的AM感知是一个非线性的过程,在低频区域或靠近基底膜蜗尖的位置AM感知能力较强。但是其中纯音载波声刺激感知和单通道的电刺激感知表现出了不同的规律,这是由两者间的感音机理差异造成的,论文中对此进行了详细分析。本文还通过信号处理理论推导和实验研究,为听觉信号中的AM提取提供了新的思路。最终通过AM在乐器识别和人工耳蜗中的应用探索了AM在人工听觉中的可用性。