论文部分内容阅读
随着计算机网络通信技术和多媒体技术的飞速发展,计算机支持的协同工作(ComputerSuppoSedCooperativeWork,简称CSCW)已成为当前计算机科学领域一个十分活跃的研究课题。目前计算机支持的协同工作理论广泛应用于诸如视频会议、多功能感知、多媒体CAI、协同办公、协同设计、协同讨论等领域。基于音频的说话人隐私保护也是远程协同工作环境中的一项重要课题。
本文首先介绍了基于音频信息中的个人特征的隐私保护的必要性及其相关的关键技术,着重介绍了有关语音处理、语音转换、语音的谱参数改变、语音的韵律参数改变的知识和目前国内外该领域的研究现状及发展方向。
然后介绍了自行分析、设计与实现的音频环境下的实时语音改变方法,对其分析过程和设计思想进行了深入详细的探讨,主要内容包括:对音频信息的特征参数提取,谱参数修改,韵律参数修改等,着重讨论了对基于音段特征的一PLAR系数曲线变换的谱参数修改的算法。同时为了得到更好的听觉效果,本文提出了自适应同步叠加(ASOLA)语音时长规整算法,以及将ASOLA算法运用到基于线性预测模型的音高规整中,实现实时语音音高规整的方法。
在介绍基于音频的实时语音改变的方法时,围绕其实现技术,对语音物理模型、信号分解、基音标注、清浊音判决、特征提取、语音重建、语音时长规整改变、语音音高规整改变、实时语音改变等一一做了介绍。
最后,运用前面研究的技术,设计实现了基于音频通信的实时说话人隐私保护原型系统。文中对该系统的功能、实现及其应用一一进行了介绍。