论文部分内容阅读
随着信息技术在通信领域的高速发展,语音编解码器也大量涌现。为了测试这些语音编解码器的质量,研究人员建立了许多主观评估方法进行全方位的测试。虽然,主观评估具有符合人对语音质量的真实感觉的优点,它也有耗费大量时间、人力资源、金钱,且灵活性不够,重复性和稳定性较差,受个体的主观因素影响大的缺点。因此,需要一种客观评估方法克服主观评估的缺陷。通过对语音质量客观评估的研究,可以极大推动语音识别、语音编码、说话人情绪分析、语音增强、语音安全技术等相关学科和领域的发展。 本文首先全面总结了各种主观、客观评估方法,并比较了各种客观评估方法的优势,展望了客观评估方法的发展方向。本文研究了当前世界最先进的基于输入/输出的客观评估算法——MNB2算法。该算法综合了可察觉和可辨别两种模型,改变了以前客观评估算法模型的单一性。本文深入研究了该算法的心理声学原理,以及针对通信频带的语音编解码器的评估算法构造,并对该算法进行了MATLAB算法仿真研究和全方位的实验。为了研究该算法对不同语音编解码器进行客观评估的准确程度;算法对不同语种的适应性;对背景噪声的适应性。实验当中对超过1500个总长约16,000秒的语音片段进行了5000多次处理,获得了约4000多个数据。结果表明,算法有很强适应性,实用性强,完全可以作为新型编码器质量评估的重要参考指标。在实验研究的基础上,对该算法模型进行了简化,并对简化模型进行了与完整模型同等的高强度测试,结果表明使用简化模型进行评估的结果与完整模型评估的结果保持了很好的一致性,简化模型可以节省一定算法所需的存储空间,实现更直接简便。 最后,使用C++语言实现了该算法,并在此基础上针对Windows 2000操作系统开发了一个集成了该算法的语音编解码器客观评估平台。平台开发中使用OOP(面向对象程序设计)技术进行开发,使用UML(统一建模语言)对评估平台进行了建模,使用DirectX技术中的DirectSound技术和多线程技术实现对大型Wlave文件的高效播放及语音波形的显示,并且为平台未来的功能扩展打下了良好基础。