高速率网络环境下基于说话人识别的VoIP语音审计系统

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:pupuaw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
VoIP(Voice Over Internet Protocol)是Internet应用领域的一项热门技术。VoIP具有低成本,开放性,灵活性等诸多优点,给人们的生活带来的很大的便利,同时也带来了网络犯罪等安全隐患,本课题采用语音识别技术自动识别说话人的身份帮助解决VoIP带来的安全问题。课题的主要研究内容有:千兆级网络环境下的零拷贝捕包:零拷贝的基本思想是网卡通过实际的物理内存把数据发送到用户应用程序,它的优势在于缩短数据传输的路径,减少数据拷贝次数和系统调用次数,避免系统在内核态和用户态之间频繁切换。在每个数据包的接收过程中,有效地减少CPU的参与,节约资源的利用。实验结果表明,基于零拷贝的高性能数据包捕获模块的捕获速度能到达线速。与传统的数据捕获平台相比,在捕获速率和效率上都得到了很大提高。本模块解决了常用捕包平台在千兆级高速网络环境下大量丢包的问题。VoIP网络数据包解析和恢复:VoIP的核心思想是对语音信号抽样编码,然后对其封包,通过IP网络进行传输,在接收端对接收到的数据包进行解析,恢复成语音数据。此过程用到下面几个协议:SIP协议是一个信令协议,用于创建,修改,释放会话;SDP协议是会话描述协议,用于描述会话信息和媒体信息;RTP协议是媒体流传输协议,负责对数据进行封包并实现媒体流的实时传输。在模块实现阶段,首先对VoIP的SIP/SDP协议进行解析,获得语音传输端口,语音压缩格式等信息,然后对负载语音数据的RTP数据包进行解析,最后把捕获的语音数据解码恢复成wav文件。说话人识别:说话人识别的关键在于为每个语音段建立模型,模型的优劣与特征参数的选取紧密相关,说话人识别常用的两种特征参数是:线性预测系数(LPCC)参数和梅尔倒谱系数(MFCC),前者根据发音模型建立,主要反应声道特征,后者根据人耳的听觉特性建立,利用人耳的听觉灵敏度与声音的频率成对数比例的关系。本系统采用MFCC参数建立矢量量化的模型,矢量量化方法是一种简单高效的方法,它将数据在多维空间予以整体量化,可以在丢失较少信息的前提下压缩数据量。本模块分为训练和识别两个阶段。在训练阶段,为每一个语音片段建立能够描述说话人特征的模型;在识别阶段,将待测的语音片段与参考模型进行模式匹配,选择匹配距离最小的语音片段对应的说话人为识别结果。实验表明:采用MFCC参数,利用矢量量化方法识别说话人能取得良好的效果。
其他文献
在信息安全领域,文件一直是攻防对抗的焦点。近几年,针对文件的攻击在数量上和复杂性上都有所发展。传统文件保护方法虽然解决了大部分威胁,但对于通过剪贴板的窃密攻击防护力度
设备作为生产的主要物质基础在现代企业中占据了重要地位,设备管理是现代企业管理的重要组成部分。设备管理的好坏直接影响着设备维修时间、维修质量、设备的可开动率以及设
多目标优化是优化问题的主要研究领域之一,现实中的优化问题—工程实践和科学研究中的优化问题,大多具备多目标的特征,并且这些目标往往是相互冲突的。不同于单目标优化问题
在电子技术发展迅速的今天,手写识别作为一种方便快捷的输入方式受到越来越多的推广和使用。然而,在无约束的自由书写过程中,即使同一字符的书写信息也会存在较大差异:包括笔
随着互联网的迅猛发展,越来越多的人成为互联网的使用者。由于针对客户端系统的攻击越来越多,用户在受益于互联网的同时,其权益也受到巨大威胁。在各种恶意软件层出不穷,攻击
IEEE 802.16e是宽带无线接入协议,802.16e中的QoS支持主要体现在物理层、数据链路层;IEEE 802.16e的MAC层对QoS服务流和参数配置了完整的信令体系、基于QoS的调度服务类别和
群体智能是指任何启发于群居性昆虫群体和其他动物群体的集体行为而设计的算法和分布式问题解决装置。群体智能具有分布性、鲁棒性、非直接通信和简单性等特点,在解决组合优
异构平台系统虚拟机技术是解决“ISA壁垒”问题的重要手段,对于促进体系结构创新和新兴处理器的推广具有重要意义。受ISA间差异影响,异构平台系统虚拟机在运行时存在较大的性能
互联网与计算机已经成为当前人们工作和生活中不可或缺的一部分,但是,在人们享受信息技术带来的便利的同时,也不得不承受计算机病毒、蠕虫等恶意代码对信息安全和个人隐私带来的
随着计算机的普及,网络的飞速发展,秘密信息和隐私的保护也越来越重要,但是当前网络中的用户秘密,隐私泄露的问题十分严重。身份认证技术是信息安全的一个重要机制,通信的双