论文部分内容阅读
随着通讯与视听技术的现代化,电信诈骗、敲诈勒索、电话威胁等其他民事或刑事案件犯罪率日渐增多。在英语、德语等其他语言的研究中发现,长时共振峰分布是说话人司法语音对比的有效辅助方法,能够清晰反映说话人声道的整体特征,还能反映出说话人的发音习惯。但长时共振峰在国内的方言,如中原官话区方言,或者在方言与普通话之间的对比中是否适用还不确定,本文将重点讨论。本研究采用定量和定性的方法分析长时共振峰分布特征。首先,使用Wavesurfer软件对语音样本进行切音,只保留元音部分,并提取共振峰数据。其次,使用Matlab对各条共振峰(F1-F4)数据进行分析,做出直方图,进行傅里叶六阶曲线拟合。最后,通过对比长时共振峰拟合曲线特征,以及对比由SPSS得出的基于长时共振峰均值的欧式距离,检验长时共振峰分布在普通话,中原官话区方言,以及在普通话与方言间的说话人区分能力。研究结果发现:1)长时共振峰分布的拟合曲线(包括峰值,峰数,峰度与偏度),与长时共振峰均值对区分不同说话人来说,是有价值的参数。2)通过具体分析,整体来说,长时共振峰分布的拟合曲线,以及长时共振峰均值在相同说话人中保持稳定的一致性,而在不同说话人中显示出明显的差异性。3)长时共振峰拟合曲线,以及长时共振峰均值分别在普通话或方言中具有较强的说话人区分力,而在普通话与方言之间的说话人区分力度稍弱。皮尔逊相关系数显示长时共振峰的均值在普通话与中原官话区方言之间具有较强的相关性。4)尽管长时共振峰分布对说话人司法语音对比来说很有价值,但由于其固有的缺陷,如不能呈现音节与音节之间的差异,丧失语音动态特征-过渡音节与协同发音,因此在说话人司法语音对比实践中,应结合其他声学和语音学的分析方法。本研究基于长时共振峰的分布特征,在普通话,中原官话区方言,以及普通话与该方言间的说话人司法语音对比中,得出适用的结论。虽然存在有待改进的问题,但本研究拓宽了长时共振峰分布在说话人司法语音对比中的应用范围。