论文部分内容阅读
[摘要]设计一个通过电话线通讯的窄带多媒体终端,这种终端支持实时视频、音频、数据交换,允许传输速率是33.6Kbps或更低。它基于ITU-T的H.324协议。
[关键词]H.324协议 多媒体终端 篱笆设计
中图分类号:TN91 文献标识码:A 文章编号:1671-7597(2009)0720008-01
一、引言
随着多媒体技术的进步,多媒体(包括视频、音频、数据)通信正成为现实。虽然已经有很多实现多媒体通信的设备,但它们都需要高达512Kbps般大小的数据传输率。这样的速率对于普通的电话线来说是不可能的。此外,昂贵的多媒体终端也不需要多媒体通信支持。这样,这种多媒体终端使用相当有限,推广并不普遍。国际电信联盟(国际电联)发布了H.324标准,让大众消费的电视会议能够通过以往的电话线路来传输[1]。H.324标准采用高质量高速率的G.729和G.723.1语音编码技术,其速率有8Kbps,6.3Kbps和5.3Kbps三种。同时也提高音频质量到32kbps的ADPCM,并采用H.263的编码算法来提高视频质量。解码产生的误差在8-15fps可接受的范围内。本文研究的问题就是低成本的H.324终端的设计和实施。首先是系统要求的规定,然后是设计事宜的描述,最后确定执行的问题。
二、H.324系统
如图1所示,该终端功能的关键是视频解码,音频解码,数据协议,控制协议,混合器,调制解调器,调制解调器控制器。
基于H.263的视频编码器对视频流编码解码。格式大小可以是SQCIF(128x96像素),QCIF(176x144像素)和CIF(352x288像素)。除了基本视频编码算法,还有另外四种编码方案用来提高功效,即(1)不受限制的运动矢量模式;(2)基于句法算术编码模式;(3)先进的预测编码模式;(4)PB模式。所有的这些方案可以单独,也可以一起使用。
G.723语音编码信号从话筒传输并进行音频编码,这作为说话者的输出。这个编码器收到16位,8khzpcm波形并压缩到5.3或6.3千比特/秒的数据。它可以以任何形式在两种码率之间切换。选择浮动码率间断传输用于非语音回放也是可能的[2]。
数据协议支持数据的应用,如电子白板,图象传输,文件交换,数据库存取。标准化的数据应用包括T.120协议音频实时图形会议,T.84协议的简单点对点静态图像文件传输,ISO/IEC TR 9577网络协议包括PPP and IP和用户数据传输使用的V.14,LPAM/V.42两种。
控制协议h.245保障h.324终端设备之间端到端信令的正确操作,命令其他所有的终端的系统功能还原到模拟语音电话形式。
多议H.223多路传输视频,音频,数据及控制流成一个单一的比特流,收到的非多重比特流分成多个多媒体流。
调制解调器V.34将H.223同步多路比特流转换成模拟信号,这样,信号就可以通过公用电话网传送;同时,V.34能把转换得到的模拟信号转换成同步比特流,即送到多路/单路控制整体[3]。
三、设计问题
(一)硬件结构
如图2:硬件要求的H.324终端组成:(1)用户接口;(2)视频接口;(3)音频接口;(4)数据接口;(5)处理器核心;(6)通讯接口。
用户界面提供了传统的用户界面功能的电话。至少,这其中包括一个键盘拨号的号码,而发声指标则是用户的来电显示。
音频接口提供了模拟语音到数字样。语音信号从麦克风采样率8千赫创造一个数码64字节数据流。同样,处理器通过数据流的返回路径议长通过音频解码器转换为数字样本返回语音。
视频界面提供了模拟电视信号到通过照相机处理的数字样本视频解码。在视频流返回路径过程中。界面转换数字视频数据为监视器播放的录像片。
数据接口是用于当数据被发送数据文本提供了一个键盘。在返回的路径过程中,得到的数据显示在液晶显示屏上。
处理器核心结构是音频,视频和数据处理方面,协议处理和管理软件功能的H.324终端。如图2,这可能包括一个数字信号处理器(DSP)充当音频视频和数据的相关职能,一个微控制器单元(MCU)负责余下的职能。
(二)软件架构
该软件体系分为H.324的控制软件,媒体处理和网络相关的软件。控制软件包括用户界面,多媒体处理和数据压缩。最后,网络相关的软件包括通信模块和协议模块。
用户界面子系统提供软件部分来处理界基于H.324的多媒体通信终端的用户。且包括下列软件模块:键盘驱动,键盘扫描及用户进入密码侦测。声音驱动用来控制产生用户铃声的硬件。用户控制所有信息和他们的数据输入并将其转换为呼叫处理。
语音自动检测系统(VAD)自动探测声音来启动或关闭数据包的传输,以优化带宽。若未被检查到,编码输出不会通过网络传输。当没有声音时,这个软件还检测由远端终端产生的接口噪声。
声音解码器接收从用户那儿传来的数据流,这种数据以64Kbps打包形式传输。以G.723.1协议压缩的数据流以5.3或6.3Kbps传输。
视频处理单元以整数倍的视频线率对样本图片抽样。H.263视频解码器采用了混合图片,并利用时间冗余和变换编码以减少冗余。解码器有采用半像素精度预测的运动补偿能力。
协议模块由控制协议模块和多路/单路模块。控制协议模块,提供两个终点协商能力。多路/单路单元提供了一种合并的机制,并通过电话系统传输各种媒体的数据。各种媒体数据包括控制,音频,视频和数据流。
应用于通信模块的V.34调制解调器转换H.223同步多路比特流成一个可以通过公用电话传送的模拟信号,并转换得到的模拟信号转换成多路/单路协议设备的同步比特流。V.34协议模式的控制信号使用大约20%的带宽[4]。
四、结束语
实施H.324多媒体通信终端,需要大量先进的实时软件处理的QOS,一个数据网络的互联互通和管理能力。本文向大家展示要实现这种终端需要通过数据网络,互联网和管理性能,利用大量的先进实时软件来提高服务质量。使用低成本的高性能新处理器结合一个系统集成芯片来解决具有成本效益的软件问题是必要的。
参考文献:
[1]蔡友发,智能型无主机防爆扩音对讲电话系统的研究,天津工业大学计算机技术与自动化学院硕士学位论文,2001.
[2]李令奇、胡广成,电话机原理与修理,北京:人民邮电出版社,1992.
[3]邱明树,电话机集成电路实用指南,北京:电子工业出版社,1997.
[4]许元兴,按键电话机故障检修400例,北京:人民邮电出版社,1993.
[关键词]H.324协议 多媒体终端 篱笆设计
中图分类号:TN91 文献标识码:A 文章编号:1671-7597(2009)0720008-01
一、引言
随着多媒体技术的进步,多媒体(包括视频、音频、数据)通信正成为现实。虽然已经有很多实现多媒体通信的设备,但它们都需要高达512Kbps般大小的数据传输率。这样的速率对于普通的电话线来说是不可能的。此外,昂贵的多媒体终端也不需要多媒体通信支持。这样,这种多媒体终端使用相当有限,推广并不普遍。国际电信联盟(国际电联)发布了H.324标准,让大众消费的电视会议能够通过以往的电话线路来传输[1]。H.324标准采用高质量高速率的G.729和G.723.1语音编码技术,其速率有8Kbps,6.3Kbps和5.3Kbps三种。同时也提高音频质量到32kbps的ADPCM,并采用H.263的编码算法来提高视频质量。解码产生的误差在8-15fps可接受的范围内。本文研究的问题就是低成本的H.324终端的设计和实施。首先是系统要求的规定,然后是设计事宜的描述,最后确定执行的问题。
二、H.324系统
如图1所示,该终端功能的关键是视频解码,音频解码,数据协议,控制协议,混合器,调制解调器,调制解调器控制器。
基于H.263的视频编码器对视频流编码解码。格式大小可以是SQCIF(128x96像素),QCIF(176x144像素)和CIF(352x288像素)。除了基本视频编码算法,还有另外四种编码方案用来提高功效,即(1)不受限制的运动矢量模式;(2)基于句法算术编码模式;(3)先进的预测编码模式;(4)PB模式。所有的这些方案可以单独,也可以一起使用。
G.723语音编码信号从话筒传输并进行音频编码,这作为说话者的输出。这个编码器收到16位,8khzpcm波形并压缩到5.3或6.3千比特/秒的数据。它可以以任何形式在两种码率之间切换。选择浮动码率间断传输用于非语音回放也是可能的[2]。
数据协议支持数据的应用,如电子白板,图象传输,文件交换,数据库存取。标准化的数据应用包括T.120协议音频实时图形会议,T.84协议的简单点对点静态图像文件传输,ISO/IEC TR 9577网络协议包括PPP and IP和用户数据传输使用的V.14,LPAM/V.42两种。
控制协议h.245保障h.324终端设备之间端到端信令的正确操作,命令其他所有的终端的系统功能还原到模拟语音电话形式。
多议H.223多路传输视频,音频,数据及控制流成一个单一的比特流,收到的非多重比特流分成多个多媒体流。
调制解调器V.34将H.223同步多路比特流转换成模拟信号,这样,信号就可以通过公用电话网传送;同时,V.34能把转换得到的模拟信号转换成同步比特流,即送到多路/单路控制整体[3]。
三、设计问题
(一)硬件结构
如图2:硬件要求的H.324终端组成:(1)用户接口;(2)视频接口;(3)音频接口;(4)数据接口;(5)处理器核心;(6)通讯接口。
用户界面提供了传统的用户界面功能的电话。至少,这其中包括一个键盘拨号的号码,而发声指标则是用户的来电显示。
音频接口提供了模拟语音到数字样。语音信号从麦克风采样率8千赫创造一个数码64字节数据流。同样,处理器通过数据流的返回路径议长通过音频解码器转换为数字样本返回语音。
视频界面提供了模拟电视信号到通过照相机处理的数字样本视频解码。在视频流返回路径过程中。界面转换数字视频数据为监视器播放的录像片。
数据接口是用于当数据被发送数据文本提供了一个键盘。在返回的路径过程中,得到的数据显示在液晶显示屏上。
处理器核心结构是音频,视频和数据处理方面,协议处理和管理软件功能的H.324终端。如图2,这可能包括一个数字信号处理器(DSP)充当音频视频和数据的相关职能,一个微控制器单元(MCU)负责余下的职能。
(二)软件架构
该软件体系分为H.324的控制软件,媒体处理和网络相关的软件。控制软件包括用户界面,多媒体处理和数据压缩。最后,网络相关的软件包括通信模块和协议模块。
用户界面子系统提供软件部分来处理界基于H.324的多媒体通信终端的用户。且包括下列软件模块:键盘驱动,键盘扫描及用户进入密码侦测。声音驱动用来控制产生用户铃声的硬件。用户控制所有信息和他们的数据输入并将其转换为呼叫处理。
语音自动检测系统(VAD)自动探测声音来启动或关闭数据包的传输,以优化带宽。若未被检查到,编码输出不会通过网络传输。当没有声音时,这个软件还检测由远端终端产生的接口噪声。
声音解码器接收从用户那儿传来的数据流,这种数据以64Kbps打包形式传输。以G.723.1协议压缩的数据流以5.3或6.3Kbps传输。
视频处理单元以整数倍的视频线率对样本图片抽样。H.263视频解码器采用了混合图片,并利用时间冗余和变换编码以减少冗余。解码器有采用半像素精度预测的运动补偿能力。
协议模块由控制协议模块和多路/单路模块。控制协议模块,提供两个终点协商能力。多路/单路单元提供了一种合并的机制,并通过电话系统传输各种媒体的数据。各种媒体数据包括控制,音频,视频和数据流。
应用于通信模块的V.34调制解调器转换H.223同步多路比特流成一个可以通过公用电话传送的模拟信号,并转换得到的模拟信号转换成多路/单路协议设备的同步比特流。V.34协议模式的控制信号使用大约20%的带宽[4]。
四、结束语
实施H.324多媒体通信终端,需要大量先进的实时软件处理的QOS,一个数据网络的互联互通和管理能力。本文向大家展示要实现这种终端需要通过数据网络,互联网和管理性能,利用大量的先进实时软件来提高服务质量。使用低成本的高性能新处理器结合一个系统集成芯片来解决具有成本效益的软件问题是必要的。
参考文献:
[1]蔡友发,智能型无主机防爆扩音对讲电话系统的研究,天津工业大学计算机技术与自动化学院硕士学位论文,2001.
[2]李令奇、胡广成,电话机原理与修理,北京:人民邮电出版社,1992.
[3]邱明树,电话机集成电路实用指南,北京:电子工业出版社,1997.
[4]许元兴,按键电话机故障检修400例,北京:人民邮电出版社,1993.