论文部分内容阅读
摘要:影响语音质量的因素很多,比如时延(Delay)、抖动(Jitter)、丢包(Packet Loss)以及R系数等。本文通过实际的优化案例分析,讲述了如何对通信网络内的所有网元的逐级分析,定位影响MOS的网员,再进行有针对性优化的一种方法。
关键词:3G WCDMA 语音质量 MOS 核心网 时延抖动
1 概述
在目前国内的移动运营商中,商用的网络包含所有类型的3G网络,这无疑会带来激烈的竞争和对3G网络发展的促进。基于用户感知的语音质量评价方法逐渐成为用户语音服务质量评测的最主要标准。
2 MOS语音质量评价方法
常用的语音质量评价方法分为主观评价和客观评价。实际网络测试中,一般市区内MOS值达到3以上的时候,就表明网络质量处于较好的水平。
然而,在现实中让一组人接听语音和评价语音质量是非常困难和昂贵的。因此,ITU组织推行了大量的端到端语音质量客观测试技术的标准化工作,发布了几种语音评估算法标准:PAMS、PSQM、PSQM+、MNB、PESQ。MOS评测开始摆脱原始的主观评估方式,而使用量化算法计算相对应的级别及语音质量好坏程度。
AMR话音编码是只针对话音的原编码过程,它是根据空中接口的无线质量动态改变编码方案。所遵循的原则是以较低的编码速率获得较好的话音质量,也就是通过添加更多的保护字段来提高话音质量。在较好的无线条件下,原编码速率提高如12.2kbps,信道编码速率可以下降;同样在无线条件差的情况下,原编码速率下降至4.75kbps,信道编码速率增加,添加更多保护字段抵抗干扰。所以AMR的作用就是在不同的无线条件下获得较恒定的话音质量。但引入AMR会增加系统的复杂程度。
在引入AMR技术后,话音处理间隔仍然是20ms,速率改变周期也可以是20ms一次。规范规定AMR一共定义了8种编码方式,各厂家设备目前普遍支持的最大速率是EFR 12.2kbps,最小速率是4.75kbps。AMR子流即是8种速率流。每种子流都是以20ms来截取话音块,所以对应12.2kbps模式20ms内244bits,10.2 kbps对应204bits,依此类推。每个子流对应比特分3个级别,为classA、B、C。规定了不同级别所对应的比特长度,其中classA级别最高,要经过严格保护,classB次级,classC级别最低几乎可以不作保护。
不同话音编码速率在不同C/I(解扩之后的载干比)情况的话音质量会有所不同,在C/I值较好的情况下,高速率的话音编码明显有较好的话音质量,但在C/I值较低的状况下,EFR、12.2等高速率编码已无法侦听,而低速率的话音编码方案仍然可以得到较好的话音质量。如在C/I=4dB时12.2对应的MOS值只有1.46,而5.9kbps方式对应的MOS值为3.69。
3 语音质量测试的主要参数
3.1 时延(Delay) 当一个数据包发送时,发送端在RTP报文头上增加一个时间戳;当在另一端被接收时,接收端同样记下接收包的时间戳;计算这两个时间戳之差可以得到这个数据包在网络中的通路时间,即时延。
3.2 抖动(Jitter) 语音信号在发送端经过压缩打包后在网络中传输时,由于数据包传送的路径可能不同,因此不同的数据包到达接收端的时间也可能不同,计算连续语音包端到端时延的差值,即抖动值。
3.3 丢包(Packet Loss) 是影响语音质量的又一个关键因素。当少量的丢包且是随机地分布时,人耳并不容易感觉到较差的语音质量,当丢包数量变大时,语音质量也就相应的变差。
3.4 R系数 ITU-T的G.107标准提出了E-Model的模型,这种模型考虑了时延、抖动、丢包、回音、编码器性能等网络损伤因素对有噪语音质量的影响。根据E模型提供的算法就可以求出相应的R值。R值的范围是0~100,0是最差的,100是最好的。
3.5 MOS值 MOS模型是主观评价方法,根据E模型MOS值是通过R值计算得到的。MOS值是1~5之间的数,1是最差的,5是最好的。
4 实际网络的优化方法
在我们对WCDMA网络进行日常优化测试的过程中,发现网络的MOS平均值为3.6,MOS值<3的比例为5.7%。其中,MOS值<3的比例不是很好,因此希望通过分析发现是什么原因导致的MOS分布问题。
在两次对同一区域MOS测试的比较中,我们发现两次测试中,MOS不好的点并不是总在一个位置。从两次测试的结果看,MOS均值以及分布也没什么规律和联系。测试结果如下表所示:
从无线优化的角度看,通常情况下,MOS的好坏与EC/NO有着直接的联系,但从测试的结果看MOS不好的点与EC/NO不好的点也没有必然联系。通过前面的测试,可以发现MOS不好的点并不是固定的。通过对定点测试的结果分析,我们得出了以下结论:
MOS不好的EC/NO不好的点并不在一起。
MOS对比Audio Quality Delay Mean:MOS不好的地方,时延会比较大,通常大于20mS。
为了进一步找到问题产生的原因,以及找出带来MOS值下降的网元,在对LOG做进一步分析的时候发现,由于鼎利给出的MOS 是呼叫的两个方向综合的结果,无法判断是从主叫到被叫的方向,还是从被叫到主叫的方向有问题,因此我们决定改用Nemo再次进行测试。而实际的应用环境也是这样的,那就是呼叫的一方信号感觉很好,但是呼叫的另一方却听的不是很清楚。所以单向MOS的计算更合理一些。并且,NEMO还可以将接收到的语言保存下来,这样可以更好的进行MOS的分析。另外,利用Agilent Signaling Analyzer可以将语言从数据帧中解析出的特性,可以看看数据在从RNC传到核心网以及在核心网中是否发生了变化。分析的其中一个呼叫:被叫MOS 不好,主叫MOS正常。
MOS的测量点语言情况以及时延抖动情况:主叫-〉被叫!2S 左右的静默进过核心网后变成了只有0.5S。根据测试发现,和RNC到核心网(CN)的时延抖动相比(通常在3mS以内),CN的RNC的时延抖动较大,(经常会见到接近10mS的)。根据从Agilent抓到的LOG看,CN发往RNC的使用有时很好,但是有时却很严重。根据对主被叫不同MOS点的语言文件的分析,以及相关时延的分析,可以确定核心网的时延是导致MOS变差的主要原因。
根据ITU-T对ATM信元的要求(I.356: B-ISDN ATM layer cell transfer performance),1类ATM的信元时延抖动(CDV)不能超过3ms,5类ATM的信元时延抖动(CDV)不能超过6ms,但石家庄核心网发出的数据包的时延抖动有时已经超出了6ms的范围,这对MOS会产生较大的影响。
在进一步的优化中,我们知道打开TRFO功能可以避免语音帧在核心网被再次处理,因而从原理上可以提高MOS值(话音质量)。但是在联通总部后续的测试过程中,增加了对MOS分布的考核(也就是MOS值小于3的比例)。而通过对MOS分布的分析发现石家庄的MOS分布不够理想,因此针对性的进行了一段时间的测试、分析,发现和核心网在打开TrFo后,有时会出现比较大的时延抖动,从而导致MOS变差。基于上面的原因,关闭核心网的TrFo功能后,再次进行测试,根据Nemo的定点测试结果,MOS 均值略有减低(3.538,3.37),但是分布要稍好(4.293%,3.434%)。在NEMO测试的基础上,用鼎力测试设备再次进行了全网的MOS测试,对比之前的测试结果,发现关闭TRFO后MOS均值并无太大波动(3.862,3.882),但是MOS分布却改善了很多(4.97%,1.30%)。基于上面的结果,决定在先关闭Trfo功能。至于核心网打开TrFo后的时延抖动问题,在后续的时间进行继续跟踪分析。关闭TRFO之前和关闭TRFO之后MOS拉网测试结果比较如下表所示:
5 结论
影响语音质量的因素很多,比如时延(Delay)、抖动(Jitter)、丢包(Packet Loss)以及R系数等。并且通信网络内的所有网元都会对语音质量产生影响,通过对网元的逐级分析,定位影响MOS的网员,在进行有针对性的优化,是提升语音质量直接有效的优化手段。
随着移动用户对语音质量的要求越来越高,语音质量的好坏也越来越直接影响着用户的对于运营商的选择和对网络质量好坏的评价,因此,通过提高网络语音服务质量改善用户感受度已经成为了WCDMA网络优化的一个重要课题。
关键词:3G WCDMA 语音质量 MOS 核心网 时延抖动
1 概述
在目前国内的移动运营商中,商用的网络包含所有类型的3G网络,这无疑会带来激烈的竞争和对3G网络发展的促进。基于用户感知的语音质量评价方法逐渐成为用户语音服务质量评测的最主要标准。
2 MOS语音质量评价方法
常用的语音质量评价方法分为主观评价和客观评价。实际网络测试中,一般市区内MOS值达到3以上的时候,就表明网络质量处于较好的水平。
然而,在现实中让一组人接听语音和评价语音质量是非常困难和昂贵的。因此,ITU组织推行了大量的端到端语音质量客观测试技术的标准化工作,发布了几种语音评估算法标准:PAMS、PSQM、PSQM+、MNB、PESQ。MOS评测开始摆脱原始的主观评估方式,而使用量化算法计算相对应的级别及语音质量好坏程度。
AMR话音编码是只针对话音的原编码过程,它是根据空中接口的无线质量动态改变编码方案。所遵循的原则是以较低的编码速率获得较好的话音质量,也就是通过添加更多的保护字段来提高话音质量。在较好的无线条件下,原编码速率提高如12.2kbps,信道编码速率可以下降;同样在无线条件差的情况下,原编码速率下降至4.75kbps,信道编码速率增加,添加更多保护字段抵抗干扰。所以AMR的作用就是在不同的无线条件下获得较恒定的话音质量。但引入AMR会增加系统的复杂程度。
在引入AMR技术后,话音处理间隔仍然是20ms,速率改变周期也可以是20ms一次。规范规定AMR一共定义了8种编码方式,各厂家设备目前普遍支持的最大速率是EFR 12.2kbps,最小速率是4.75kbps。AMR子流即是8种速率流。每种子流都是以20ms来截取话音块,所以对应12.2kbps模式20ms内244bits,10.2 kbps对应204bits,依此类推。每个子流对应比特分3个级别,为classA、B、C。规定了不同级别所对应的比特长度,其中classA级别最高,要经过严格保护,classB次级,classC级别最低几乎可以不作保护。
不同话音编码速率在不同C/I(解扩之后的载干比)情况的话音质量会有所不同,在C/I值较好的情况下,高速率的话音编码明显有较好的话音质量,但在C/I值较低的状况下,EFR、12.2等高速率编码已无法侦听,而低速率的话音编码方案仍然可以得到较好的话音质量。如在C/I=4dB时12.2对应的MOS值只有1.46,而5.9kbps方式对应的MOS值为3.69。
3 语音质量测试的主要参数
3.1 时延(Delay) 当一个数据包发送时,发送端在RTP报文头上增加一个时间戳;当在另一端被接收时,接收端同样记下接收包的时间戳;计算这两个时间戳之差可以得到这个数据包在网络中的通路时间,即时延。
3.2 抖动(Jitter) 语音信号在发送端经过压缩打包后在网络中传输时,由于数据包传送的路径可能不同,因此不同的数据包到达接收端的时间也可能不同,计算连续语音包端到端时延的差值,即抖动值。
3.3 丢包(Packet Loss) 是影响语音质量的又一个关键因素。当少量的丢包且是随机地分布时,人耳并不容易感觉到较差的语音质量,当丢包数量变大时,语音质量也就相应的变差。
3.4 R系数 ITU-T的G.107标准提出了E-Model的模型,这种模型考虑了时延、抖动、丢包、回音、编码器性能等网络损伤因素对有噪语音质量的影响。根据E模型提供的算法就可以求出相应的R值。R值的范围是0~100,0是最差的,100是最好的。
3.5 MOS值 MOS模型是主观评价方法,根据E模型MOS值是通过R值计算得到的。MOS值是1~5之间的数,1是最差的,5是最好的。
4 实际网络的优化方法
在我们对WCDMA网络进行日常优化测试的过程中,发现网络的MOS平均值为3.6,MOS值<3的比例为5.7%。其中,MOS值<3的比例不是很好,因此希望通过分析发现是什么原因导致的MOS分布问题。
在两次对同一区域MOS测试的比较中,我们发现两次测试中,MOS不好的点并不是总在一个位置。从两次测试的结果看,MOS均值以及分布也没什么规律和联系。测试结果如下表所示:
从无线优化的角度看,通常情况下,MOS的好坏与EC/NO有着直接的联系,但从测试的结果看MOS不好的点与EC/NO不好的点也没有必然联系。通过前面的测试,可以发现MOS不好的点并不是固定的。通过对定点测试的结果分析,我们得出了以下结论:
MOS不好的EC/NO不好的点并不在一起。
MOS对比Audio Quality Delay Mean:MOS不好的地方,时延会比较大,通常大于20mS。
为了进一步找到问题产生的原因,以及找出带来MOS值下降的网元,在对LOG做进一步分析的时候发现,由于鼎利给出的MOS 是呼叫的两个方向综合的结果,无法判断是从主叫到被叫的方向,还是从被叫到主叫的方向有问题,因此我们决定改用Nemo再次进行测试。而实际的应用环境也是这样的,那就是呼叫的一方信号感觉很好,但是呼叫的另一方却听的不是很清楚。所以单向MOS的计算更合理一些。并且,NEMO还可以将接收到的语言保存下来,这样可以更好的进行MOS的分析。另外,利用Agilent Signaling Analyzer可以将语言从数据帧中解析出的特性,可以看看数据在从RNC传到核心网以及在核心网中是否发生了变化。分析的其中一个呼叫:被叫MOS 不好,主叫MOS正常。
MOS的测量点语言情况以及时延抖动情况:主叫-〉被叫!2S 左右的静默进过核心网后变成了只有0.5S。根据测试发现,和RNC到核心网(CN)的时延抖动相比(通常在3mS以内),CN的RNC的时延抖动较大,(经常会见到接近10mS的)。根据从Agilent抓到的LOG看,CN发往RNC的使用有时很好,但是有时却很严重。根据对主被叫不同MOS点的语言文件的分析,以及相关时延的分析,可以确定核心网的时延是导致MOS变差的主要原因。
根据ITU-T对ATM信元的要求(I.356: B-ISDN ATM layer cell transfer performance),1类ATM的信元时延抖动(CDV)不能超过3ms,5类ATM的信元时延抖动(CDV)不能超过6ms,但石家庄核心网发出的数据包的时延抖动有时已经超出了6ms的范围,这对MOS会产生较大的影响。
在进一步的优化中,我们知道打开TRFO功能可以避免语音帧在核心网被再次处理,因而从原理上可以提高MOS值(话音质量)。但是在联通总部后续的测试过程中,增加了对MOS分布的考核(也就是MOS值小于3的比例)。而通过对MOS分布的分析发现石家庄的MOS分布不够理想,因此针对性的进行了一段时间的测试、分析,发现和核心网在打开TrFo后,有时会出现比较大的时延抖动,从而导致MOS变差。基于上面的原因,关闭核心网的TrFo功能后,再次进行测试,根据Nemo的定点测试结果,MOS 均值略有减低(3.538,3.37),但是分布要稍好(4.293%,3.434%)。在NEMO测试的基础上,用鼎力测试设备再次进行了全网的MOS测试,对比之前的测试结果,发现关闭TRFO后MOS均值并无太大波动(3.862,3.882),但是MOS分布却改善了很多(4.97%,1.30%)。基于上面的结果,决定在先关闭Trfo功能。至于核心网打开TrFo后的时延抖动问题,在后续的时间进行继续跟踪分析。关闭TRFO之前和关闭TRFO之后MOS拉网测试结果比较如下表所示:
5 结论
影响语音质量的因素很多,比如时延(Delay)、抖动(Jitter)、丢包(Packet Loss)以及R系数等。并且通信网络内的所有网元都会对语音质量产生影响,通过对网元的逐级分析,定位影响MOS的网员,在进行有针对性的优化,是提升语音质量直接有效的优化手段。
随着移动用户对语音质量的要求越来越高,语音质量的好坏也越来越直接影响着用户的对于运营商的选择和对网络质量好坏的评价,因此,通过提高网络语音服务质量改善用户感受度已经成为了WCDMA网络优化的一个重要课题。