网络音频数据分类标注与前处理系统构建

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:dfqq209
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,互联网的迅速发展和网络音频数据量的急剧上升使得对网络音频数据的分类处理需求日益复杂。网络多媒体数据的获取与预处理则是各种音频处理应用的共同基础。本文的研究内容是网络多媒体数据的获取、音频剥离解码和基于音频分类标注的预处理,并设计和开发一个网络音频数据分类标注与前处理系统。具体工作内容如下:(1)在网络数据获取方面,搜索指定范围内的多媒体数据,对于可直接下载的网络数据则直接下载,并以文件为单位进行后续的音频帧剥离与解码、类别标注和识别检索等处理;对于只能在线播放的网络流媒体数据,则首先对网络流媒体协议进行解析,根据所用协议类型,生成基于实时流传输协议RTSP(Real Time Streaming Protocol)的虚拟客户端,并以流的形式将数据下载。平台采用ffmpeg实现对主流多媒体编码格式和实时流媒体的音频剥离与解码。(2)在音频数据类别标注方面,采用了支持向量机(Support Vector Machine,SVM)方法对音频数据进行类别判定,首先将音频数据分为静音类和非静音类,再对非静音类划分为语音类和非语音类,其中语音类再划分成纯语音类和非纯语音类,非语音类则划分为音乐类和环境类。制定了一个具体的标注规范,将对应文件的音频类别及其起止时间标注在文件的末尾。(3)在系统设计方面,采用自顶向下的模块化设计方法,从系统的需求出发进行分析,将系统分为数据获取、节目管理、解码信息和文件结构信息提取、伴音剥离、音频分类与标注、结果输出与外部功能挂载七大模块,设计了各模块的工作流程与接口,各模块协同实现平台的数据获取、音频剥离与解码、音频数据类别标注和外部模块加载等功能。从而可根据需要,使平台成为具有指定处理功能的系统。本文采用C++完成了系统的实现工作,并进行了实际的测试。测试结果表明,系统的功能达到了预期的目标,所采用的网络数据获取和分类标注方法具有良好的效果,且系统对外接口能方便挂载关键词检测、样例检索等功能模块,系统运行稳定。
其他文献
高质量图像输入输出设备的出现,使得票据的伪造变得更加容易,这对大量发行和使用的票据来说无疑是个巨大冲击。利用数字水印技术在票据纸张上实现防伪,是票据防伪的一个发展方向
随着数据仓库广泛应用带来的良好影响,数据仓库技术得到了迅猛的发展。数据仓库中最常用、最重要的查询语句的执行效率直接影响了数据仓库的性能,在查询处理中将查询语句重写
运钞车辆路径问题是VRP问题的一个实际应用。对运钞车辆的行车路径进行合理的管理和规划,是降低运钞成本、提高运钞车工作效率和安全性的有效手段。本文以运钞车辆路径问题为
无线传感器网络(Wireless Sensor Networks,WSNs)具有资源有限、以数据为中心、节点数量众多且分布密集等特点,因此为了最大化网络的生命周期,在实现无线传感器网络的关键技术时,必
在零售业,营销分析发挥着重要作用,同时,数据仓库因用于存储历史销售数据而得到了广泛应用。然而,随着数据规模的急剧增长,各企业数据管理和营销分析的水平不一且发展极不均
随着网络应用的发展和安全形势的变化,互联网安全需求也随之有了新的变化和发展。爆发式的恶意软件(Malware)增长和传播使得传统的恶意软件检测方法无法及时、有效的分析和处
获取用户手机的信息必须先发送相应的指令到HLR设备,HLR设备的应答报文是由大量英文字母组成的半结构化文件,如何从半结构化文件当中高效准确的抽取可用的信息是论文研究的主要
P2P技术使当今的互联网发生了日新月异的变化,它改变了以服务器为中心的传统网络模式,提供了一种全新的获取资源的方式,得到了广泛应用。然而,P2P应用却带来了网络流量的急剧增长
近年来,随着移动应用软件数目逐渐庞大以及软件构架的日益复杂化,软件测试在确保软件质量方面发挥着重要作用。接口测试作为测试系统组件间接口的一种测试,具有成本小效率高
超分辨率图像重建技术是指从低分辨率图像序列中重建出一幅高分辨率图像,这些图像有噪声、欠采样并且模糊但是相互之间具有互补信息。这项技术不需要改变现有的硬件设备,只通过