论文部分内容阅读
摘要:广告收入是廣播电台收入的主要来源。服务好客户、减少广告漏播是赢取客户信赖的保证。本系统采用声纹识别算法,检测慢录音频中广告播出记录。慢录系统使用Windows系统底层的Core Audio API进行稳定可靠的音频采集,并将音频编码为高效且适用网络传输的opus格式。本系统也可通过节目的标乐查找其在录音中的起始位置,并在Pc和移动端的浏览器上远程播放,大大提高了节目评审效率。
关键词:声纹识别;广告监播;节目评审;慢录;Core Audio opus
总局62号令提出了广播电视安全播出工作应当坚持“不间断、高质量、既经济、又安全”的方针。可见,在保证安全播出的前提下,我们也要体现质量与效益的方针,保持市场竞争力。目前,我台的广告监播任务和各频率的评稿工作主要靠人工完成,每月手动拷贝几十上百G的S48格式音频,然后手动查找音频。根据这两个应用场景的需求,笔者利用声纹比对技术,在我台原有的办公网络硬件资源上设计实现了一套即经济又高效的慢录节目、广告审听系统。
本系统包含3个主要子系统:
一、录音系统
录音系统如下图所示,从音频矩阵获取本台三个频率的播出信号,并将其经由音频采集卡输入到录音工作站中。工作站中的录音程序将接收到的音频PCM码流转换为opus格式,存储到音频音频存储服务器上,并将音频的录制时间、存储位置和提取的声纹等索引信息保存到音频管理服务器的数据库中,以待后续的识别和检索。
本系统录音采用的opus格式是一种开源、免费、自由度高的有损音频编解格式,已经被标准化互联网组织IETF认证通过,并被纳入H5标准,它融合了Skype的SILK和XVID的CELT技术,对音频中语音和音乐可采用动态调节的比特率,即能保存音乐部分的细节又大大提高了压缩比率。它还具有良好的鲁棒性丢失率和数据包丢失隐藏,在网络状态不佳时也能保证本系统的查询客户端正常监听服务器上的音频记录。
二、广告、节目播出自动检查系统
广告播出情况的自动检测流程如下图所示。
在本系统中,对广告播出情况的检测和对节目播出情况的检测都是采取音频声纹比对技术实现的。所以,系统检测流程大致相同。只是节目自动检测时,与录音声纹比对的是节目片头的声纹,而不是像广告一样用整条广告的声纹进行比对。
3.广告、节目播出记录查询系统。
广告、节目的查询系统采用Bs架构。系统包括服务器端和客户端两部分:
服务器端包括一台音频管理服务器和一台音频存储服务器。音频存储服务器用来存储录制的opus格式的音频文件。音频管理服务器的数据库使用MariaDB,Web服务器使用Apache,服务器脚本使用PHP。以上服务全部使用UPUPW套件快速部署。在内网中,Pc客户端通过交换机与服务器连接,移动客户端经由无线路由连接交换机再连接服务器。外网客户端经由IP地址映射访问内网服务器,通过防火墙与内网实行安全隔离。客户端安装Firefox浏览器以登录广告节目查询程序页面。
本系统将本台的广告监播和节目评审工作实现了自动化、网络化,大大提高了工作效率。当然,系统也存在一些可以改进的地方。比如,在匹配音频存在拉伸时,系统无法通过求众数直接得到时间差,需进一步处理。但在实际应用中,录播节目一般不会产生延时器删除而产生的拉伸。此外,现阶段版本的系统也可采用mp3格式进行音频存储,以快速实现手机APP客户端和微信小程序客户端,以提升用户体验。
关键词:声纹识别;广告监播;节目评审;慢录;Core Audio opus
总局62号令提出了广播电视安全播出工作应当坚持“不间断、高质量、既经济、又安全”的方针。可见,在保证安全播出的前提下,我们也要体现质量与效益的方针,保持市场竞争力。目前,我台的广告监播任务和各频率的评稿工作主要靠人工完成,每月手动拷贝几十上百G的S48格式音频,然后手动查找音频。根据这两个应用场景的需求,笔者利用声纹比对技术,在我台原有的办公网络硬件资源上设计实现了一套即经济又高效的慢录节目、广告审听系统。
本系统包含3个主要子系统:
一、录音系统
录音系统如下图所示,从音频矩阵获取本台三个频率的播出信号,并将其经由音频采集卡输入到录音工作站中。工作站中的录音程序将接收到的音频PCM码流转换为opus格式,存储到音频音频存储服务器上,并将音频的录制时间、存储位置和提取的声纹等索引信息保存到音频管理服务器的数据库中,以待后续的识别和检索。
本系统录音采用的opus格式是一种开源、免费、自由度高的有损音频编解格式,已经被标准化互联网组织IETF认证通过,并被纳入H5标准,它融合了Skype的SILK和XVID的CELT技术,对音频中语音和音乐可采用动态调节的比特率,即能保存音乐部分的细节又大大提高了压缩比率。它还具有良好的鲁棒性丢失率和数据包丢失隐藏,在网络状态不佳时也能保证本系统的查询客户端正常监听服务器上的音频记录。
二、广告、节目播出自动检查系统
广告播出情况的自动检测流程如下图所示。
在本系统中,对广告播出情况的检测和对节目播出情况的检测都是采取音频声纹比对技术实现的。所以,系统检测流程大致相同。只是节目自动检测时,与录音声纹比对的是节目片头的声纹,而不是像广告一样用整条广告的声纹进行比对。
3.广告、节目播出记录查询系统。
广告、节目的查询系统采用Bs架构。系统包括服务器端和客户端两部分:
服务器端包括一台音频管理服务器和一台音频存储服务器。音频存储服务器用来存储录制的opus格式的音频文件。音频管理服务器的数据库使用MariaDB,Web服务器使用Apache,服务器脚本使用PHP。以上服务全部使用UPUPW套件快速部署。在内网中,Pc客户端通过交换机与服务器连接,移动客户端经由无线路由连接交换机再连接服务器。外网客户端经由IP地址映射访问内网服务器,通过防火墙与内网实行安全隔离。客户端安装Firefox浏览器以登录广告节目查询程序页面。
本系统将本台的广告监播和节目评审工作实现了自动化、网络化,大大提高了工作效率。当然,系统也存在一些可以改进的地方。比如,在匹配音频存在拉伸时,系统无法通过求众数直接得到时间差,需进一步处理。但在实际应用中,录播节目一般不会产生延时器删除而产生的拉伸。此外,现阶段版本的系统也可采用mp3格式进行音频存储,以快速实现手机APP客户端和微信小程序客户端,以提升用户体验。