实时语音改变技术研究与实现

来源 :江苏大学 | 被引量 : 0次 | 上传用户:weishuange0l
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络通信技术和多媒体技术的飞速发展,计算机支持的协同工作(ComputerSuppoSedCooperativeWork,简称CSCW)已成为当前计算机科学领域一个十分活跃的研究课题。目前计算机支持的协同工作理论广泛应用于诸如视频会议、多功能感知、多媒体CAI、协同办公、协同设计、协同讨论等领域。基于音频的说话人隐私保护也是远程协同工作环境中的一项重要课题。 本文首先介绍了基于音频信息中的个人特征的隐私保护的必要性及其相关的关键技术,着重介绍了有关语音处理、语音转换、语音的谱参数改变、语音的韵律参数改变的知识和目前国内外该领域的研究现状及发展方向。 然后介绍了自行分析、设计与实现的音频环境下的实时语音改变方法,对其分析过程和设计思想进行了深入详细的探讨,主要内容包括:对音频信息的特征参数提取,谱参数修改,韵律参数修改等,着重讨论了对基于音段特征的一PLAR系数曲线变换的谱参数修改的算法。同时为了得到更好的听觉效果,本文提出了自适应同步叠加(ASOLA)语音时长规整算法,以及将ASOLA算法运用到基于线性预测模型的音高规整中,实现实时语音音高规整的方法。 在介绍基于音频的实时语音改变的方法时,围绕其实现技术,对语音物理模型、信号分解、基音标注、清浊音判决、特征提取、语音重建、语音时长规整改变、语音音高规整改变、实时语音改变等一一做了介绍。 最后,运用前面研究的技术,设计实现了基于音频通信的实时说话人隐私保护原型系统。文中对该系统的功能、实现及其应用一一进行了介绍。
其他文献
ARTs-OS的中断管理模型是在对各种实时系统实现技术的评估和系统的具体需求的分析基础上建立的.ARTs-OS的中断模型包括了中断模拟、中断的优先级调度、中断屏蔽、核外中断等
该文从理论和实践两个方面,对面向对象的中间件技术进行研究.论文首先从系统建模的角度论述了面向对象的重要概念和通用建模语言(UML),然后研究了三种主流的面向对象中间件技
近年来,电信网综合通信能力明显增强,运营商必须提供更多的多媒体业务才能吸引住用户,因此网络面临的压力越来越大。在这一发展背景下,基于软交换技术的下一代网络(NGN)技术应运
该论文中利用中文信息检索标准测试集,对信息检索系统及其算法进行了科学客观的评价,并对中文信息检索的最佳检索单元进行了详细的讨论和研究,在此基础上,重点讨论和研究了利
SAN使存储资源与服务器分离,可以提供100兆字节/秒的高性能数据管道和共享的集中管理的存储设备,使得数据的访问、备份和恢复不会大幅度降低网络性能,消除人们对网络带宽的顾虑。
随着Internet的飞速发展和广泛应用,大量的网络病毒已将Internet作为其一种主要的传播途径。网络病毒传播的方式很多,如通过访问网页、电子邮件以及FTP文件传输等等。为了使Web
机器学习的方法在数据挖掘领域有广泛的应用。在当今的机器学习领域,人们经常采用多预测模型的方法以提高预测的准确性。所有这些多预测模型方法可以归为两类:(1)专家方法 (2)
学位
Petri网是一种用于描述系统的动态行为和分析系统的动态性质的数学模型,对描述和分析并发现象有其独到的优越之处,非常适合于异步并发系统的建模。为了刻划同系统行为密切相关