基于MNB2算法的语音编解码器客观评估平台研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:fengjikun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术在通信领域的高速发展,语音编解码器也大量涌现。为了测试这些语音编解码器的质量,研究人员建立了许多主观评估方法进行全方位的测试。虽然,主观评估具有符合人对语音质量的真实感觉的优点,它也有耗费大量时间、人力资源、金钱,且灵活性不够,重复性和稳定性较差,受个体的主观因素影响大的缺点。因此,需要一种客观评估方法克服主观评估的缺陷。通过对语音质量客观评估的研究,可以极大推动语音识别、语音编码、说话人情绪分析、语音增强、语音安全技术等相关学科和领域的发展。 本文首先全面总结了各种主观、客观评估方法,并比较了各种客观评估方法的优势,展望了客观评估方法的发展方向。本文研究了当前世界最先进的基于输入/输出的客观评估算法——MNB2算法。该算法综合了可察觉和可辨别两种模型,改变了以前客观评估算法模型的单一性。本文深入研究了该算法的心理声学原理,以及针对通信频带的语音编解码器的评估算法构造,并对该算法进行了MATLAB算法仿真研究和全方位的实验。为了研究该算法对不同语音编解码器进行客观评估的准确程度;算法对不同语种的适应性;对背景噪声的适应性。实验当中对超过1500个总长约16,000秒的语音片段进行了5000多次处理,获得了约4000多个数据。结果表明,算法有很强适应性,实用性强,完全可以作为新型编码器质量评估的重要参考指标。在实验研究的基础上,对该算法模型进行了简化,并对简化模型进行了与完整模型同等的高强度测试,结果表明使用简化模型进行评估的结果与完整模型评估的结果保持了很好的一致性,简化模型可以节省一定算法所需的存储空间,实现更直接简便。 最后,使用C++语言实现了该算法,并在此基础上针对Windows 2000操作系统开发了一个集成了该算法的语音编解码器客观评估平台。平台开发中使用OOP(面向对象程序设计)技术进行开发,使用UML(统一建模语言)对评估平台进行了建模,使用DirectX技术中的DirectSound技术和多线程技术实现对大型Wlave文件的高效播放及语音波形的显示,并且为平台未来的功能扩展打下了良好基础。
其他文献
随着连铸产量的不断增加,近年来宝钢条钢厂宝钢在生产规格上主要以板坯、方坯、圆坯为主.但条钢厂在品种规格多样化、大压缩比、生产组织灵活性方面具有有利的条件,尤其是圆
本文叙述了CAD的发展,以及CSCW与CAD技术相结合而产生的CSCD。各种形式的CSCD系统使设计能充分发挥不同领域的知识和专家的经验,协同高效的工作,从而产生出高质量的设计结果。现
本课题将以太网技术应用到生物发酵过程控制中,实现了一个基于以太网的生物发酵嵌入式两级计算机控制系统。以太网的冲突检测载波监听多点访问技术(CSMA/CD)引起了“非确定性”
现场总线是一种串行的数字数据通信链路,它沟通了生产领域的基本控制过程之间以及与更高层次控制过程的自动化控制设备之间的联系。随着自动化技术的进步发展,各种现场总线以其
信息网格是最近兴起的一种崭新的技术,是网格技术中的一个重要研究方向。它是要利用现有的网络基础设施、协议规范、Web和数据库技术,为用户提供一体化的智能信息平台,其目标是
本文结合基金会现场总线技术,对工业过程中大量使用的蒸发器和锅炉进行了控制系统应用研究。利用机理建模法建立了多效蒸发器液位的数学模型,并用计算机和相应数据采集模件对双
超声心动图是目前临床心脏病诊断检查中主要的无创性方法,本文提出了用机械臂系统来辅助医生进行超声心动图检查的设想。本设计的研究主要分为两个部分:第一部分是有关机械臂结
现场总线控制系统是继分散控制系统之后出现的新一代控制系统。现场总线控制系统的出现使工业现场仪表也面临着一场新的变革。数字化,智能化,以及网络化是现场仪表的发展方向。
ATM(Asynchronous Transform Mode)——异步传输模式网络技术,是当前宽带网络(如ADSL、VDSL等)的核心技术,自1994年以来已从实验室研究大量走向实际应用。它结合了电路网络和计