论文部分内容阅读
对于人类交流来说,嗓音是一种必不可少的手段,并且嗓音的好坏直接影响着人们的交流。随着对嗓音的过度以及不当使用,嗓音的相关发声器官发生器质性或神经性的病变而使得发声系统进行了非正常发声从而产生了病理嗓音。共振峰是源于嗓音声道模型的一个重要的声学参数,同时也是嗓音修正中的重要参数。本文提出了采用LSM-扩展型双线性变换对病理嗓音共振峰进行修正。主要研究了基于线谱对的病理嗓音共振峰修正,利用线谱对对共振峰的跟踪特性,通过对与共振峰相关的线谱对区间即线谱对参数进行修正,从而达到修正共振峰的目的。而采用线谱对方法提取共振峰,便于快速确认与共振峰相关的线谱对区间。在采用线谱对提取共振峰的方法中,嗓音的第一、二共振峰与线谱对区间的对应关系集中在排序后最小的四个线谱对区间中,而病理嗓音的第一、二共振峰与线谱对区间的对应关系并不满足这个范围,针对病理嗓音修正了线谱对区间的对应范围。对采用线谱对方法提取的不同类别病理嗓音以及正常嗓音的第一、二共振峰,本文采用Kruskal-Wallis检验进行了差异性分析,分析结果表明不同类别的病理嗓音共振峰的分布并不一致,针对共振峰分布存在差异性的问题提出了LSM(Line spectral pairs Segment fixed value Migration,线谱对分段定值偏移)的方法,通过对共振峰偏移比例值的分析,对不同范围、不同类别的病理嗓音采用了不同的偏移参数对线谱对区间进行变换,有效修正了病理嗓音的第一、二共振峰。在LSM法的基础上,进一步提出了LSM-扩展型双线性变换法对共振峰进行修正。对于部分病理嗓音(如甲亢嗓音、小结嗓音)的共振峰,LSM法仍然不能非常好的使得其修正后的共振峰落入正常共振峰的范围内,针对LSM方法不具备非线性偏移的‘柔性’,分析了频率弯折函数,采用扩展型双线性变换对其进行非线性偏移,有效改善了修正效果。对比极点位置法,线谱对失真测度在甲亢、息肉、小结、水肿这四种病理嗓音上分别降低了59%、62%、63%、47%,KL距离在甲亢、息肉、小结、水肿这四种病理嗓音上分别提高了167%、125%、158%、88%。。对比定值偏移法,线谱对失真测度则分别降低了42%、39%、38%、32%,同时KL距离分别提高了84%、47%、63%、66%,说明了共振峰修正方法的有效性。