基于PESQ算法的广播节目语音质量评测系统设计与实现

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:maxiao19810628
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:语音信号是现代通信系统传输的重要信号之一,语音信号的大量使用,使得语音信号发送传输技术研究持续发展。因此,如何对语音信号质量评估就成为改变广播行业的重要课题。本项目基于保证节目语音质量考虑量,提出采用PESQ算法模型,并设计实现基于PESQ算法的广播语音技术质量评测系统。
  关键词:PESQ;广播语音质量,MOS;音频质量评估
  中图分类号:TP37 文献标识码:A 文章编号:1009-3044(2018)07-0178-02
  现今传媒业之间竞争日趋激烈,传统媒体代表--广播电视,面临市场份额严重缩水和影响力持续下降的影响,要改变不利局面,既要改变节目形式,增加节目内容,还要提高播出节目的语音质量。广播节目语音质量,指的是经访谈、录音、编辑、传输发送后语音信息的保真度。假如播出的节目语音差,出现回声、畸变、音量过低或过高等情况,就会影响宣传效果,节目内容再好也难获得较高的收视收听率。该文正是基于以上考虑,提出并设计实现基于PESQ算法的广播语音技术质量评测系统。
  1 广播语音质量测评系统简介
  广播语音质量测评系统采用PESQ (Perceptual Evaluation of Speech Quality) 感知通话质量评估算法,依据部分感知标准作出对语音信号的质量的客观评价,设计实现一种可量化的语音质量評测方法,并且这些评测标准完全符合人们对语音质量的体验。评估系统接收电台播出的语音信号,将信号进行解调,利用算法进行质量评测,获得语音信号经发送传输后的失真状况。
  语音评测系统将电台传输来的语音信号进行A/D转换,经同步处理后,获得语音失真相关数据,再依据选择的测量方法对失真语音信号展开算法分析处理,获得相关测度差离值。最后比照先验模板,最终得到相对应的MOS值。
  在语音质量评测系统中,通过对应的测度算法实现,使用设计的软件包来完成评测。即通过PESQ算法来分析失真语音信号,实现得到相应的测度差离值。在模板对应中,一定要有相应的先验模板作为参照。这要求在PESQ算法实现以后,需开展大量实践实验,获得广播通信多种情况的先验模板,从而可集成到相应的PESQ测度的MOS分值。
  2 PESQ 算法
  与PEQM标准不同,PESQ 是基于感知模型的语音质量客观评价标准。针对通信系统中出现的线性滤波和可时间延迟这两个问题,PESQ做了改进,在对差值曲面的解释中,既考虑误差的分布,又考虑误差的总量,同时增强了端到端语音通信质量的可靠性评价。PESQ 算法结构如图2所示。
  PESQ算法的设计思想是:首先电平对齐参考信号和经过被测系统信号,使之符合听觉电平要求标准。再使用输入滤波器进行滤波。通过电平对齐和输入滤波对两个信号进行时间对准均衡处理,实施听觉变换,获得系统中增益变化和线性滤波的均衡和补偿。听觉变换后对两个信号间区别进行扰动处理,提取出两个失真参数,在时间和频率上累计得出PESQ 分值,最后将该分值与主观意见的预估值( MOS 值)进行映射 。
  3 基于PESQ算法的广播语音质量评测系统设计
  3.1 系统硬件结构
  评测系统硬件结构包含支撑模块、业务处理模块、后台管理模块、信令处理模块和语音音质量测评系统,能实现录音、放音以及评测等功能,它的硬件结构如图3:
  语音业务前台主要包含语音信令处理、数据库处理、呼叫处理等几个部分。信令处理功能提供BICC、H.248 、SIP等呼叫协议处理功能。
  语音业务后台主要完成的是系统支撑功能,负责提供人机交互接口、网络管理接口等,实现了加载程序、配置数据、管理设备和模块间通信等功能。
  数据库处理单元完成存储语音数据等数据库管理功能,建立连接语音评估功能架构的接口,最后由语音评测评系统对语音质量进行评估。
  3.2 系统整体设计
  根据语音评测流程,语音质量评测系统应由语音采样、语音传送、音频质量评测、GUI界面呈现四个部分组成。语音质量测评系统的架构设计如图4 所示:
  3.3系统实现流程
  语音质量评测总体实现流程图如图5所示:
  评测系统首先配置相应测试脚本,提供指令创建无线链接,通过解码提取音频数据,以便控制发送原样本语音数据和采集采样数据,该批次数据采样结束后结合 PESQ 评估算法进行语音质量评测,得出相关MOS 分值,将评估结果以CUI界面呈现,并可对比播放采样语音和样本语音。
  PESQ评测系统通过对比样本信号和降级信号,使样本信号通过一个通信体系得到结果。系统先对样本信号和经过网络传输的退化信号进行电平调整,再模拟听筒用输入滤波器滤波。两个信号需校准时间点,并利用听觉变换对系统中增益变化和线性滤波进行均衡和补偿,再结合感知模型,映射出主观平均意见分;在干扰度计算中需识别出坏区间,这需重新对齐坏区间。总的来说,样本信号和输出信号的差异性越大,得出的MOS分值就越低。
  4 结束语
  评测系统采用PESQ作为测量MOS 值的基本算法,实现由 PESQ 算法验证评测准确性,并进行语音MOS 值评分,从相关度和残余误差两个参数来看,PESQ算法改进了判定依据。结合后台实现的各测试指标的性能统计对比功能, 整个语音质量评测系统基本实现了现在强调的 QoE(Quality Of Experience)要求。
  参考文献:
  [1] GBT 16463-1996 广播节目声音质量主观评价方法和技术指标要求[S].
  [2] 安泽华.广播节目声音质量的客观测量与主观评价[J].电声技术,2015,38(11):38-40.
  [3] 荆滢,张慧.电视节目技术质量评测指标体系与方法研究[J].现代电视技术, 2013(6):19-20.
  [4] 李怀畅.WMA流媒体音质测试与分析[J]. 电声技术,2014,38(12):67-69.
其他文献
随着通信技术的不断发展,很多视频图像都有着很高的分辨率,现在很多高清图像的无线传输都是通过压缩后实现的,这样在很多设备在输出源文件时均不具备压缩动作,所以要研究一种
本文从地方经济发展对计算机科学与技术专业人才培养的目标出发,根据学校专业布局及专业实践情况,讨论了课程体系建立,应用型师资培养,并探讨了专业学生创新能力培养的基本模式。
目的观察阿法D3治疗慢性肾功能衰竭继发甲状旁腺功能亢进症的临床疗效.方法对38例行血液透析的慢性肾功能衰竭继发甲状旁腺功能亢进症病人用1α(OH)D3治疗,以血钙(Ca)及血全
脂蛋白(a)是脑梗塞的危险因素,与遗传有关[1].血清脂蛋白(a)[Lp(a)]增高是年轻人脑梗塞形成和发展最有价值的指标[2].目前降脂药物主要针对胆固醇(TC),低密度脂蛋白胆固醇(LD
[目的]探讨膳食教育对经阴道手术病人发生便秘的影响,预防便秘的发生,促进阴式切口的愈合。[方法]将妇科择期手术188例术后病人随机分为实验组和对照组。实验组于术前1 d及术