临场感多点音频会议的研究与实现

来源 :清华大学 | 被引量 : 0次 | 上传用户:newlifeinsydney
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该论文工作的成果既可作为一个独立的系统供多人同时进行语音交流,也可作为一个子系统,应用在远程网络会议、虚拟战场、机器人遥现遥操作、远程医疗、漫游及娱乐等方面.该文针对实现有临场感的多点音频舆论会议系统所面临的问题,具体做了以下工作:一、混音方面;在基于NATIVEATM网络互联的SUN工作站上研制了混音系统,实现了用于混音的、将声音转换为具有线性特征数据格式的方法.二、虚拟三维音场方面,深入研究了人们双耳聆听时声源三维定位的原理,实现了:水平方向依据声音到达双耳时的时间、相位和声音的强弱差异,垂直方向依据声波的衍射,最终结合听觉的首次波阵面法则来进行声源的三维定位.采用单声道麦克风作为系统的输入设备、以耳机或扬声器作为系统的输出设备,设计实现了三维空间定位系统.在软件开发过程中,采用对象式方法、部分使用了COM技术,有利于系统的重用、更新和扩展、随着各方面认识的加深,在程序设计过程中提出并使用了一些能显著改善的程序性能方法,例如:声音采集模块的消息控制机制,声音输出模块的缓冲区控制方法、声音传输模块支持多协议的结构设计.该总值研究成果是以太网互联的PC机上实现的三维多声源混音系统.三、音频数据的传输方面;深入研究并分析了目前各种不同类型LAN的实时音频传输性能.选择了较有代表性以太网和ATM网进行实验.在ATM网络环境下,对于音频传致命难点,实时数据流的传输抖动,依据所测定的网络传输抖动界限,并经过相应的计算,得到网络接收端缓冲区应具有大小,最终达到到消除抖动的目的.在以太网环境下,采用WINDOWS支持的最新SOCKET2.0版本,使开发出的程序易于在不同网络环境间移植.在程序中加入简单的QoS控制;错误重传和延时丢弃的功能.
其他文献
该文以统计过程控制法和缺陷正交分类法为例详细介绍了如何针对不同的软件项目的特点和不同的软件组织的情况进行定量分析方法的设计,重点说明了数据模型和典型算法的设计思
邮政金融网络系统覆盖面广、业务繁多、实时性强,对业务数据安全可靠性有很高要求.该文针对邮政金融网络系统的特点,从网络系统以及运行在网络上的应用系统两方面着手,对如何
人工神经网络是目前国际上迅速发展的前湍研究方向之一.它模拟生物神经结构,具有广泛的应用前景,对它的研究已取得了很多丰硕的成果.人工神经网络具有很强的逼近非线性及大规
该文针对Monad理论方法探讨了Monad本身的一些理论问题同时也讨论了Monad这一理论模型在软件技术中的一些重要应用.在Monad理论方面,该文给出了异型Monad系统之间的转移方法,
该论文为了解决协调问题,把整个二维复合参数区域当作一个凸多边形区域来考虑,提出了基于尺寸约束的节点-单元一体化自动生成算法,对于边界复杂的区域采用改进的Delaunay三角
该论文从《石油行业物资供应管理信息系统》的研制出发,介绍了数字签名与认证的数学原理、公钥基础设施的一般原理,郑重介绍了密钥管理子系统、数字审批与签证子系统的原理及
该论文针对因特网的不安全因素(非法入侵),以保护个人电脑为目的,制定了单机版防火墙系统的体系结构,并设计实现了其中的数据包过滤子系统.该文主要工作有以下几点:1、在对因
该文系统的论述了HN-CIMS系统中,基于组件技术、多层软件结构的MRPⅡ系统的设计与实现.
该文提出一种适用于计算机应用能力的网上CAI制作工具的方法,其基本思想是:利用面向对象技术,对应用领域进行深入细致的分析,归纳出系统的对象,并对对象控件化,用户只须设置
该论文研究的课题是1752芯片的研究, 主要研究1750A系统输入输出控制及自测试程序的研究.作为1750A系统设计的一部分,1752与1750ACPU和1751(COMBO)协同工作,实现嵌入式系统17