论文部分内容阅读
摘要:多媒体网络教学是把计算机技术、多媒体技术、网络技术和现代教学方法有机结合起来的一种全新模式的教学活动。近几年,国内外涌现了大量的多媒体教学软件,大多数都具有几个基本的功能模块。如音/视频交互、电子白板、教学广播、教学资源读取、具有特定的用户角色和权限控制等,为人们的学习、教育活动带来了极大的便利。本文基于交换式网络结构,详细分析了RTP(Real-time Transport Protoc01)。以及视音频数据的采集、压缩、传输机制。阐述了构建多媒体网络教学系统的要素。
关键词:多媒体网络教学 RTP 视音频 信息传输
0 引言
随着计算机技术的发展,多媒体网络教学已经成为与传统教学同等重要的一种教学模式,网络教学既能有进行集体协作型教学,又可以进行个别化教学。给学生明确的教学目的、鲜明的教学目标、丰富的教学内容和灵活的学习方法,具有多样化的教学形式,更可以把文字、图形、图像、声音、动画、视频等多媒体信息集合于一体,信息处理能力强,信息处理速度快,激发学生的学习兴趣,调动学生的积极性,实行网络监控,并在教师容许情况下,可以让学生查阅和运行各种教学软件,让学生充分发挥自己的才能,拓展自己的智慧。其在资源共享,时间、空间利用率、可重复性操作上有着不可比拟的优越性。然而多媒体数据流量大,在传输过程重,极容易引起网络拥塞与延迟,影响正常的教学活动,因此必须要采取多种技术,充分利用各种资源来进行高效的网络数据传输,可从两个方向入手,一方面对待传输的视音频数据进行压缩编码,降低数据冗余率:另一方面是根据不同的网络拓扑结构应用不同的传输协议优化传输算法。
1 视音频数据的压缩
通过视音频数据采集设备采集到的数据含有大量的冗余信息,需要对其进行压缩处理。对于视屏数据,目前广泛采用H.264规范,H.264,是由ITU-T视频编码专家组(VCEG)和ISD/IEC动态图像专家组(MPEG)联合组成的联合视频组(JVT,Joint Video Team)提出的高度压缩数字视频编解码器标准。它最大的优势是具有很高的数据压缩比率,在同等图像质量的条件下,H.264的压缩比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。举个例子,原始文件的大小如果为88GB,采用MPEG-2压缩标准压缩后变成3.5GB,压缩比为25:1,而采用H.264压缩标准压缩后变为879MB,从88GB到879MB,H.264的压缩比达到惊人的102:11 H.264为什么有那么高的压缩比?低码率(Low Bit Rate)起了重要的作用,和MPEG-2和MPEG-4 ASP等压缩技术相比,H.264压缩技术将大大节省用户的下载时间和数据流量收费。尤其值得一提的是,H.264在具有高压缩比的同时还拥有高质量流畅的图像。H.264是在MPEG-4技术的基础之上建立起来的,其编解码流程主要包括5个部分:帧间和帧内预测(Estimation)、变换(Transform)和反变换、量化(Quantiza-tion)和反量化、环路滤波(Loop Filter)、熵编码(Entropy Coding)。H.264/MPEG-4 AVC(H.264)是1995年自MPEG-2视频压缩标准发布以后的最新、最有前途的视频压缩标准。H.264是由ITU-T和JSO/IEC的联合开发组共同开发的最新国际视频编码标准。通过该标准,在同等图象质量下的压缩效率比以前的标准提高了2倍以上,因此,H.264被普遍认为是最有影响力的行业标准。
2 音频数据的压缩
对于音频数据,自1995年以后,普遍采用G.729压缩标准。其压缩原理是电话线路上的模拟语音信号,经话路带宽滤波(符合I-TU-T G.712建议)后,被8kHz采样,量化成16bit线性PCM数字信号输入到编码器。该编码器是基于线性预测分析合成技术,尽量减少实际语音与合成语音之间经听觉加权后差分信号的能量为准则来进行编码的。编码器的其主要部分有:线性预测分析和LPC系数的量化;开环基音周期估计;自适应码本搜索;固定码本搜索;码本增益量化。对应解码算法也是按帧进行的,主要是对符合G.729协议的码流进行解码,得到相应的参数,根据语音产生的机理,合成语音。解码过程主要分为:参数解码:后滤波处理。
3 应用RTP协议
RTP(Real-time Transport Protocol)是用于Intenret上针对多媒体数据流的一种传输协议。RTP被定义为在一对一或一对多的传输情况下工作。其目的是提供时间信息和实现流同步。RTP通常使用UDP来传送数据,可以在TCP或ATM等其他协议之上工作。当应用程序开始一个RTP会话时将使用两个端口:一个给RTP一个给RTCP。RTP本身并不能为接顺序传送数据包提供可靠的传送机制。也不提供流量控制或拥塞控制。它依靠RTCP提供这些服务。通常RIP算法并不作为一个独立的网络层来实现。而是作为应用程序代码的一部分。实时传送控制协议RTCP(Real-time Transport Control Protocol)和RTP提供流量控制和拥塞控制。在RTP会话期间,各参与者周期性地传送RTCP包。RTCP包中含有已发送的数据包的数量、丢失的数据包的数量等统计资料。因此,服务器可以利用这些信息动态地改变传输速率,甚至改变有效载荷类型。RTP和RTCP配合使用,它们能以有效的反馈和最小的开销使传输效率最佳化,因而特别适合传送网上的实时数据。
4 多媒体网络教学系统的架构
物理实体层:体现为实现多媒体网络的各种物理实体。就一个教室而言,包括服务器、教师用机、学生用机、网络设备:就编辑中心而言,包括视频采集卡、录像机、数码相机、扫描仪、多媒体编辑和图形、动画工作站等。
网络层:相当于OSI的数据链路层、网络层和传输层。它们为高层应用提供可靠的网络保证。
多媒体网络层:由于一般网络层较难支持对多媒体的实时传输,因此我们在此基础上再附一层,这是一个面向实时传输和QOS的层次,使上层能透明调用。
编辑制作层:网络教学内容编辑器是一个基于网络的在线收集、分类、编辑软件系统,可以对课件的总体框架进行构思,同时应有提纲描述语言到课件语言的自动转换工具。课件应有自己的文件描述语言,同时课件编辑器应是一个可视化的编辑环境,除了表现手段外,课件编辑系统还应能很方便地表示控制流,并能实现面向对象的课件编辑。
教学环境层:处于最顶层的教学环境是基于Client/Server(Browser/Server)的分布式系统,它能完成以下功能:异步(当然也能同步)地为每个学生提供相同或不同的课件学习服务;保持对学生学习过程的记录:感知学生当前的学习状态和遇到的困难,并能对常见问题进行分析、引导、提示。
5 总结与展望
本文在网络技术的基础上,针对多媒体网络教学交互性的特点,深刻分析了交互式多媒体网络教学系统的机理以及构建多媒体网络教学系统的要素,目的是为实现多媒体网络教学的功能并建立起一个交互式应用平台提供一个良好的基础,使得用户可以根据自己的需求搭建不同的交互式多媒体网络教学应用。
科学技术的发展是永无止境的,嵌入式系统的逐渐成熟以及智能手机、无线设备的普及,为移动学习提供了很好的硬件环境,将移动学习平台与有线多媒体网络教学系统进行集成,多媒体网络教学技术逐渐走向成熟。另外,在智能化、全球化的大趋势下,多媒体网络教学仍然有非常大的发展空间,随着流媒体技术、分布式操作系统、数字有机体等技术的发展,多媒体网络教学最终会向着智能化、全球化方向发展,形成一个巨大的国际网络学园。
关键词:多媒体网络教学 RTP 视音频 信息传输
0 引言
随着计算机技术的发展,多媒体网络教学已经成为与传统教学同等重要的一种教学模式,网络教学既能有进行集体协作型教学,又可以进行个别化教学。给学生明确的教学目的、鲜明的教学目标、丰富的教学内容和灵活的学习方法,具有多样化的教学形式,更可以把文字、图形、图像、声音、动画、视频等多媒体信息集合于一体,信息处理能力强,信息处理速度快,激发学生的学习兴趣,调动学生的积极性,实行网络监控,并在教师容许情况下,可以让学生查阅和运行各种教学软件,让学生充分发挥自己的才能,拓展自己的智慧。其在资源共享,时间、空间利用率、可重复性操作上有着不可比拟的优越性。然而多媒体数据流量大,在传输过程重,极容易引起网络拥塞与延迟,影响正常的教学活动,因此必须要采取多种技术,充分利用各种资源来进行高效的网络数据传输,可从两个方向入手,一方面对待传输的视音频数据进行压缩编码,降低数据冗余率:另一方面是根据不同的网络拓扑结构应用不同的传输协议优化传输算法。
1 视音频数据的压缩
通过视音频数据采集设备采集到的数据含有大量的冗余信息,需要对其进行压缩处理。对于视屏数据,目前广泛采用H.264规范,H.264,是由ITU-T视频编码专家组(VCEG)和ISD/IEC动态图像专家组(MPEG)联合组成的联合视频组(JVT,Joint Video Team)提出的高度压缩数字视频编解码器标准。它最大的优势是具有很高的数据压缩比率,在同等图像质量的条件下,H.264的压缩比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。举个例子,原始文件的大小如果为88GB,采用MPEG-2压缩标准压缩后变成3.5GB,压缩比为25:1,而采用H.264压缩标准压缩后变为879MB,从88GB到879MB,H.264的压缩比达到惊人的102:11 H.264为什么有那么高的压缩比?低码率(Low Bit Rate)起了重要的作用,和MPEG-2和MPEG-4 ASP等压缩技术相比,H.264压缩技术将大大节省用户的下载时间和数据流量收费。尤其值得一提的是,H.264在具有高压缩比的同时还拥有高质量流畅的图像。H.264是在MPEG-4技术的基础之上建立起来的,其编解码流程主要包括5个部分:帧间和帧内预测(Estimation)、变换(Transform)和反变换、量化(Quantiza-tion)和反量化、环路滤波(Loop Filter)、熵编码(Entropy Coding)。H.264/MPEG-4 AVC(H.264)是1995年自MPEG-2视频压缩标准发布以后的最新、最有前途的视频压缩标准。H.264是由ITU-T和JSO/IEC的联合开发组共同开发的最新国际视频编码标准。通过该标准,在同等图象质量下的压缩效率比以前的标准提高了2倍以上,因此,H.264被普遍认为是最有影响力的行业标准。
2 音频数据的压缩
对于音频数据,自1995年以后,普遍采用G.729压缩标准。其压缩原理是电话线路上的模拟语音信号,经话路带宽滤波(符合I-TU-T G.712建议)后,被8kHz采样,量化成16bit线性PCM数字信号输入到编码器。该编码器是基于线性预测分析合成技术,尽量减少实际语音与合成语音之间经听觉加权后差分信号的能量为准则来进行编码的。编码器的其主要部分有:线性预测分析和LPC系数的量化;开环基音周期估计;自适应码本搜索;固定码本搜索;码本增益量化。对应解码算法也是按帧进行的,主要是对符合G.729协议的码流进行解码,得到相应的参数,根据语音产生的机理,合成语音。解码过程主要分为:参数解码:后滤波处理。
3 应用RTP协议
RTP(Real-time Transport Protocol)是用于Intenret上针对多媒体数据流的一种传输协议。RTP被定义为在一对一或一对多的传输情况下工作。其目的是提供时间信息和实现流同步。RTP通常使用UDP来传送数据,可以在TCP或ATM等其他协议之上工作。当应用程序开始一个RTP会话时将使用两个端口:一个给RTP一个给RTCP。RTP本身并不能为接顺序传送数据包提供可靠的传送机制。也不提供流量控制或拥塞控制。它依靠RTCP提供这些服务。通常RIP算法并不作为一个独立的网络层来实现。而是作为应用程序代码的一部分。实时传送控制协议RTCP(Real-time Transport Control Protocol)和RTP提供流量控制和拥塞控制。在RTP会话期间,各参与者周期性地传送RTCP包。RTCP包中含有已发送的数据包的数量、丢失的数据包的数量等统计资料。因此,服务器可以利用这些信息动态地改变传输速率,甚至改变有效载荷类型。RTP和RTCP配合使用,它们能以有效的反馈和最小的开销使传输效率最佳化,因而特别适合传送网上的实时数据。
4 多媒体网络教学系统的架构
物理实体层:体现为实现多媒体网络的各种物理实体。就一个教室而言,包括服务器、教师用机、学生用机、网络设备:就编辑中心而言,包括视频采集卡、录像机、数码相机、扫描仪、多媒体编辑和图形、动画工作站等。
网络层:相当于OSI的数据链路层、网络层和传输层。它们为高层应用提供可靠的网络保证。
多媒体网络层:由于一般网络层较难支持对多媒体的实时传输,因此我们在此基础上再附一层,这是一个面向实时传输和QOS的层次,使上层能透明调用。
编辑制作层:网络教学内容编辑器是一个基于网络的在线收集、分类、编辑软件系统,可以对课件的总体框架进行构思,同时应有提纲描述语言到课件语言的自动转换工具。课件应有自己的文件描述语言,同时课件编辑器应是一个可视化的编辑环境,除了表现手段外,课件编辑系统还应能很方便地表示控制流,并能实现面向对象的课件编辑。
教学环境层:处于最顶层的教学环境是基于Client/Server(Browser/Server)的分布式系统,它能完成以下功能:异步(当然也能同步)地为每个学生提供相同或不同的课件学习服务;保持对学生学习过程的记录:感知学生当前的学习状态和遇到的困难,并能对常见问题进行分析、引导、提示。
5 总结与展望
本文在网络技术的基础上,针对多媒体网络教学交互性的特点,深刻分析了交互式多媒体网络教学系统的机理以及构建多媒体网络教学系统的要素,目的是为实现多媒体网络教学的功能并建立起一个交互式应用平台提供一个良好的基础,使得用户可以根据自己的需求搭建不同的交互式多媒体网络教学应用。
科学技术的发展是永无止境的,嵌入式系统的逐渐成熟以及智能手机、无线设备的普及,为移动学习提供了很好的硬件环境,将移动学习平台与有线多媒体网络教学系统进行集成,多媒体网络教学技术逐渐走向成熟。另外,在智能化、全球化的大趋势下,多媒体网络教学仍然有非常大的发展空间,随着流媒体技术、分布式操作系统、数字有机体等技术的发展,多媒体网络教学最终会向着智能化、全球化方向发展,形成一个巨大的国际网络学园。