论文部分内容阅读
该论文工作的成果既可作为一个独立的系统供多人同时进行语音交流,也可作为一个子系统,应用在远程网络会议、虚拟战场、机器人遥现遥操作、远程医疗、漫游及娱乐等方面.该文针对实现有临场感的多点音频舆论会议系统所面临的问题,具体做了以下工作:一、混音方面;在基于NATIVEATM网络互联的SUN工作站上研制了混音系统,实现了用于混音的、将声音转换为具有线性特征数据格式的方法.二、虚拟三维音场方面,深入研究了人们双耳聆听时声源三维定位的原理,实现了:水平方向依据声音到达双耳时的时间、相位和声音的强弱差异,垂直方向依据声波的衍射,最终结合听觉的首次波阵面法则来进行声源的三维定位.采用单声道麦克风作为系统的输入设备、以耳机或扬声器作为系统的输出设备,设计实现了三维空间定位系统.在软件开发过程中,采用对象式方法、部分使用了COM技术,有利于系统的重用、更新和扩展、随着各方面认识的加深,在程序设计过程中提出并使用了一些能显著改善的程序性能方法,例如:声音采集模块的消息控制机制,声音输出模块的缓冲区控制方法、声音传输模块支持多协议的结构设计.该总值研究成果是以太网互联的PC机上实现的三维多声源混音系统.三、音频数据的传输方面;深入研究并分析了目前各种不同类型LAN的实时音频传输性能.选择了较有代表性以太网和ATM网进行实验.在ATM网络环境下,对于音频传致命难点,实时数据流的传输抖动,依据所测定的网络传输抖动界限,并经过相应的计算,得到网络接收端缓冲区应具有大小,最终达到到消除抖动的目的.在以太网环境下,采用WINDOWS支持的最新SOCKET2.0版本,使开发出的程序易于在不同网络环境间移植.在程序中加入简单的QoS控制;错误重传和延时丢弃的功能.