论文部分内容阅读
随着我国广播电台事业的发展,音频节目播出作为其中一个产物,改变了广播电台的业务流程。对音频的判决是音频节目播出前必不可少的环节,它肩负着节目播出质量和安全的重任。音频判决能够对电台播出的音频节目进行静音检测、电平偏移超标检测、VU超标检测、立体声相位反相检测、不可听检测、削波检测等。它还可以对电台节目的内容进行检测,检测音频中是否包含敏感信息并且对其进行定位,确保电台节目的安全播出。广播节目信号质量和内容的检测如果依靠传统的人工方式开展,将面临诸多困难,人耳无法辨识以高倍速播放的声音内容,容易造成漏检误检,并且整个过程需要投入大量的人力和物力。本文针对上述问题,在对音频判决的背景进行了解和系统需求进行分析后,以音频节目为研究对象,结合数理统计方法、数字信号处理、语音识别等技术,设计并实现了音频判决系统。与传统方法相比,音频判决系统有着效率高、速度快、漏检率低等特点。本文对音频素材的质量和内容分别进行检测,完成的工作主要包括以下几点:1)运用FFmpeg技术对音频文件进行解码,获取音频信号参数如采样率、比特率、声道数、采样格式等。为后续的判决工作提供前期准备。2)详细研究并实现了基于信号特征的音频判决模块,模块主要完成音频质量检测部分,包括静音检测、电平偏移超标检测、VU超标检测、立体声反相检测、不可听检测、削波检测等。通过音频Wave文件提供的信息以及对音频采样数据进行处理或变换来实现音频质量的检测。3)详细研究并实现了基于内容特征的音频判决模块,模块主要完成对音频内容的检测。基于科大讯飞移动语音平台,并结合语音识别技术对打开的音频文件进行全文识别,给出相应的识别结果,再从这些文本结果检索给定的关键词,最后对出现的关键词进行定位。本文实现的音频判决系统能够在实验环境下测试完成良好,能够精确检测出质量不合格的音频并且能够定位出现关键词的音频段,从而达到初期目标。