多媒体通信技术第8章+分布式多媒体应用+ppt课件.ppt
第 8 章 分布式多媒体应用,8.1 引言 8.2 多媒体会议系统 8.3 视频点播系统 8.4 远程教育系统 8.5 远程医疗系统,8.1 引 言,从信息交换方式来看, 分布式多媒体应用系统可以分成下列四类: 点对点非实时应用。 点对多点非实时应用。 点对点实时应用。 点对多点实时应用。,从系统构成模型来看, 分布式多媒体应用系统可分成下列两类: 对等模型。 在应用系统中, 只有一类节点, 具有双重身份, 既是信源又是用户, 并且各个节点的地位是对等的, 信息交互具有对称性, 即一个节点发送的信息量和接收的信息量大致是平衡的。 典型的应用系统如多媒体会议系统、 可视电话系统等。 客户/服务器模型。在应用系统中, 有两类节点: 客户和服务器。服务器是信源, 为客户提供信息服务; 客户是使用信息的用户, 根据需要向服务器发出服务请求, 并且接收服务器返回的响应信息。 服务器可以面向很多客户提供服务, 并且信息交互具有不对称性, 客户到服务器的上行信道的信息量要远远小于服务器到客户的下行信道的信息量。典型的应用系统如视频点播系统、多媒体信息发布系统等。,8.2 多媒体会议系统,8.2.1 多媒体会议系统关键技术,1. 网络环境 多媒体会议系统是一种典型的点对多点实时应用系统, 对网络基础设施支持实时传输的能力要求较高, 也直接影响到视频和音频的质量。 对于ATM、 LAN或384 kb/s 的ISDN, 可支持全屏幕、 30帧/秒的视频和广播质量的音频; 对于128 kb/s基本速率的ISDN, 可支持1/4屏幕CIF(356288)、1020帧/秒的视频和AM质量的声音; 对于电话线, 一般只能支持610帧/秒的Quarter CIF(176144)或更低质量的视频图像。,总体上, 多媒体会议系统的网络环境可分成基于电路交换的网络环境和基于分组交换的网络环境。在基于电路交换的网络中, 一次数据通信要经历三个阶段: 建立连接、 数据传输和拆除连接, 而且这种连接是一种点到点的专用链路, 典型的网络是窄带ISDN(N-ISDN)或电话线路等, ITU-T制定了一系列相关的国际标准。 在基于分组交换的网络中, 数据通信分成面向连接(虚电路)和无连接(数据报)两种方式, 其中虚电路通信也要经历三个阶段: 建立连接、数据传输和拆除连接, 但这种连接是一种共享链路, 典型的网络是帧中继、ATM和各种LAN。 基于分组交换网络的多媒体会议系统不仅可应用在广域网上, 也可应用于各种LAN环境。,2. 多点传送,图 8.1 多点会议系统的一般结构,3. 编解码器 编解码器(CODEC)是会议终端对音频和视频信息进行编码和解码的重要部件, 可采用硬件或软件方法来实现, 硬编解码器的性能好, 但费用高。 通过信息编码还可以实现数据压缩, 以减少传输的数据量。 ITU制定了一系列有关音频和视频编解码器的国际标准, 音频编码标准有G.711、G.722或G.728, 视频编码标准有H.261、 H.263以及MPEG等, 不同编码器所采用的数据压缩算法不同, 其数据率和重建的语音/图像质量也不同。,4. 会议控制 会议控制提供了控制和管理会议进程的一组服务, 包括会议注册、 会议宣布、 会议启动、 会议发现以及会议的加入、 退出、 查询等。 ITU在T.120标准中定义了有关会议控制功能, IETF也制定了基于IP分组网的会议控制协议标准。 IETF的会议控制协议标准采用一组协议实现会议控制和会议发现, 它们是: 会话描述协议(SDP)、 会话宣布协议(SAP)和会话启动协议(SIP)等。,8.2.2 会议系统相关的国际标准,8.2.2.1 H.320 H.320是 ITU-T最先提出的一种关于会议系统的国际标准, 该标准是针对基于电路交换的N-ISDN网络环境(其带宽为64 kb/s2 Mb/s)而定义的, 它包含了如下几个标准: H.261: 视频编解码器, 视频压缩后的数据率为P64 kb/s, 即使用64 kb/s整数倍速率的信道, 最高达1920 kb/s。为了使NTSC和PAL制式之间相兼容, 它定义了公共中间格式(CIF)。, G.711、G.722或G.728(可选的): 音频编解码器。其中, G.711为PCM编解码器标准, 其速率为64 kb/s, 是标准的电话语音编码; G.728为码激励线性预测(CELP) 编解码器标准, 其速率为16 kb/s, 是3.4 kHz电话质量的语音压缩编码; G.722是一种7 kHz调频广播质量的语音编码标准, 其速率在64 kb/s以内。 H.221: 定义了64 kb/s2 Mb/s会议信道的体系结构和帧格式。 H.242和H.243: 规定了建立连接时的呼叫控制, 系统控制单元通过端到网络信令进行网络访问, 通过端到端信令进行端到端的控制。, H.230: 定义了系统中所使用的控制和指示信令。 H.231: 描述了组成多点会议的多点控制单元(MCU)及其功能。 H.233和H.234: 定义了会议系统的信息加密方法以及在不同节点之间传送密钥方法和其它管理事项。 H.224: 定义了一种简单、 快捷的无连接传输协议。 H.281: 描述了建立在H.224之上的点到点、 点到多点的单向远端摄像机控制方法。 10 T.120: 定义了多媒体会议的数据协议。,8.2.2.2 H.323 H.323标准是针对无QoS保障的局域网(LAN)会议系统而制定的, 无QoS保障的局域网是指以太网、快速以太网、FDDI、令牌环形网等。 会议终端和设备可以承载实时音频、视频和数据,或者是它们的任意组合。局域网可以是单网段或多网段结构, 多网段局域网的会议终端操作性能要差一些。 H.323采用了IETF的实时传输协议(RTP), 为不可靠的UDP传输和不稳定的局域网提供了一种补偿方法, 使得媒体流能够持续地播放。 这样, 凡是符合H.323标准的会议系统都可以在Internet上应用。, 视频编解码器:,表8.1 会议终端的视频图像格式, 音频编解码器: G.711、 G.722、 G.723、 G.728和G.729。 所有标准的局域网会议终端都应提供按G.711进行语音编解码的能力。 对于G.722、 G.723、 G.728和G.729等编解码器的使用, 则是可选的, 并且编解码器所使用的音频算法应在能力协商过程中来确定。 此外, 会议终端可以具有非对称操作能力, 例如它能够发送G.711音频, 而接收的是G.728音频。 会议终端可以有选择地同时发送和接收多个音频通道, 例如在一个会议中, 允许传送两种语言的音频信号。在这种情况下, 终端可能需要执行音频混合功能, 以便向用户提交复合的音频信号。, 会议信道: 会议信道结构和帧格式由H.225定义, 而通信呼叫、能力交换、命令和指示信令、逻辑通道控制等则由H.245定义。 相应地, H.322建议描述了有QoS保障的局域网会议系统, 有QoS保障的局域网是指综合业务局域网(IEEE 802.9A), 它能够提供等时传送服务。,8.2.2.3 H.324 H.324是基于电话网的会议系统标准。低比特率多媒体会议终端可以使用调制解调器(MODEM)接入普通交换电话网(GSTN)。 在H.324中所使用的调制解调器应当在全双工、同步模式下操作, 并遵循ITU-T V.34和V.8(用于启动GSTN上数据通信会话的规程)标准。终端可以承载实时语音、 视频和数据, 或者是它们的任意组合。终端可以集成在个人计算机上, 以内置或外置方式实现, 内置式以插件板形式插在计算机内; 外置式则以独立的设备(如视频电话)来实现。 基于电话网的会议系统可以通过MCU进行多点配置。,H.324的视频编码器支持H.263和H.261, 可以使用五种标准的图像格式: 16CIF、 4CIF、 CIF、QCIF和SQCIF, 其中CIF和QCIF由H.261定义, SQCIF、 4CIF和16CIF 由H.263定义, 但编解码器必须支持QCIF和SQCIF格式。 H.324的音频编码器采用G.723.1.1。多路复用分接协议采用H.223, 它把音频、视频和数据集中于一个流中, 按逻辑通道传输, 多路复用的输出直接加到V.34的同步数据端, 而逻辑通道用H.245协议控制。,8.2.2.4 数据协议,图 8.2 会议系统的数据协议模型,表8.2 ITU-T制定的有关会议系统标准,8.2.3 典型的桌面多媒体会议系统,1. CU-SeeMe,图 8.3 会议系统的反射节点,(1) 系统配置 CU-SeeMe对硬件配置的要求比较低, 最初的系统配置只要求386SX以上的微机、 256色以下640480分辨率的显示器、声卡、 话筒及扬声器。如果要发送图像, 则需要配置摄像机及其视频卡, 或者使用QuickCam数字摄像机, 它直接连接在并行口上, 不需要额外的视频卡, 可以提供每秒15帧的160120图像, 且价格比较便宜。 用户可以LAN方式连网或者以SLIPPPP(Serial Line Internet Protocol/Point to Point Protocol)拨号方式连网。对于拨号入网的用户, 要求调制解调器的波特率应在14.4 kb/s以上, 但是这种速率不支持声音的接收。 若要同时支持声音和图像的传送, 则需要28.8 kb/s以上波特率的调制解调器。,(2) 系统功能 CU-SeeMe 启动时将自动检测计算机的配置, 以确定用户的工作模式。如果该计算机配置了摄像机, 则进入发送/接收模式; 否则将进入接收模式。 会议系统启动后, 计算机屏幕上将出现一个会话窗口, 它提供如下的选项: File: 音频和视频设置; Edit: 与会用户设置, 允许最多同时打开8个视频窗口。 每个窗口下都有关于该窗口的传输速率显示以及该窗口操作的功能键。 通过点击功能键可以选择此窗口的一些特性; Window: 窗口排列、 字体选择等外观设置; Conference: 会议主菜单选项, 有如下的功能:,Connect: 设置通信对方的IP地址, 对于点对点通信, 它是一个使用CU-SeeMe用户的IP地址; 对于点对多点通信, 它是一个反射器的IP地址。 Disconnect: 中断当前的连接。 Start/Stop Receiving (Sending) Video: 控制视频流的收发。 Show Audio Panel: 控制音量大小、 通过按键发送音频流和设置音频接收模式。 Show talk window: 用于传输文本信息, 窗口分上、 下两部分: 上部分为接收区; 下部分为发送区。 Participant: 会议控制, 如只接收某人的视频或音频流、 关闭某人的窗口、与某人进行保密性对话等。,2. Mbone系列软件 Mbone (Multicast Backbone)是IETF在Internet建立的一个虚拟网络, 其目的是利用Internet进行音频、视频和文件的组播传输实验。 在Mbone中, 用户可以看到来自太空和海底的视频图像, 以及一些专题讨论会的实况转播。 在Mbone中提供了一些软件工具, 用于支持多媒体信息的传输, 它们采用RTP /UDP/IP协议集, 以保证数据传输的实时性和稳定性。,图8.4 vat主窗口,图8.5 vic主窗口,图8.6 wb控制窗口,图8.7 白板空间,(1) 系统功能 NetMeeting视频会议提供了如下的功能: 用户可以与会者之间进行音频和视频的切换, 使用户可以方便地与任何一个与会者进行交流。 在会议进行过程中, 系统可根据网络传输速率自动调节视频的带宽和质量, 用户还可以远程调节视频的质量。 用户可以动态调整所发送视频信号的分辨率。 用户可以暂停或继续视频的发送和接收。, 支持H.323协议中的会议服务和网关, 以实现多点音频和视频传输。 多个用户之间可以实时进行通信和协同工作。 用户可以共享应用程序, 通过共享剪贴板实现信息交换、传送文件、共享白板以及闲聊程序。 此外, 通过支持T.120协议, 使系统可以与其它基于T.120协议的产品互操作。 用户可以通过ILS(Internet Locator Server)来获取其他与会者的信息。 支持LDAP标准, 具有增强的用户接口和邮件扩展功能。,(2) 框架结构,图8.8 NetMeeting系统框架结构,8.3 视频点播系统,图8.9 基于客户/服务器的VOD系统模型,通常, 一个VOD系统可以为用户提供如下视频点播服务: 影视点播。 点播电影或电视节目, 用户可以通过快进、 快退和慢放等控制功能控制播放过程。 信息浏览。 浏览各种商品购物和广告信息, 或者查看股票、 证券和房地产行情等信息。 远程教育。 收看教学节目, 选择课程和内容, 做练习, 模拟考试, 自我测试。 交互游戏。将视频游戏下载到用户终端上, 用户可以和远程的其他用户一起参加游戏。,8.3.1 VOD系统关键技术,1. 网络支撑环境 VOD系统是一种基于客户/服务器模型的点对点实时应用系统, 视频服务器可同时为很多用户提供点对点的即时视频点播服务。为了获得较高的视频和音频的质量, 要求网络基础设施应能提供高带宽、低延迟和支持QoS等传输特性。通常, 视频服务器应连接在高速网络上, 如ATM、 高速交换式LAN或者高速光纤WAN等, 使之具有较高的网络吞吐量。,VOD系统的网络环境可以是LAN也可以是WAN。 在LAN环境下应用VOD系统时, 多媒体的传输性能和演示质量一般能够得到保证。而目前的WAN环境(如Internet)却很难保证VOD系统的服务质量。从发展角度来看, Internet将是VOD应用的广阔空间, 但必须解决Internet高速化问题。 另外, VOD系统作为ITV可以在公用电视(CATV)网上应用, 但必须解决两个问题: 一是将CATV网的单向通道改造成双向通道(上行通道和下行通道); 二是使用适当的用户接入设备(如Cable MODEM等)来连接CATV网。,2. 视频服务器, 信息存储组织。 信息获取机制。 群集服务器结构。,3. 用户接纳控制 视频服务器将面向很多用户提供视频点播服务。 当有一个新的用户服务请求到来时, 服务器必须使用适当的接纳控制(Admission Control)算法来保证在接受该服务请求后使系统中正在接受服务的用户请求的QoS不受影响。 接纳控制算法可以分成下列三类: 确定型接纳控制算法。 根据系统资源的使用情况做最坏的估计, 在最坏的情况下, 接纳一个新的服务请求必须确保能够满足当前正在接受服务的所有服务请求的QoS为前提。这是最悲观的接纳控制算法。,统计型接纳控制算法。按照某种统计算法对一定数量的服务请求(如60%)做出最坏估计, 只要系统资源允许, 便可以接纳新的服务请求。 统计型接纳控制算法的资源利用率比确定型的高, 但是要求用户能够容忍QoS在一定范围的波动。 测量型接纳控制算法。对系统资源的过去使用情况进行分析, 得到一个综合测量值, 根据这个测量值, 对未来使用情况做出估计, 以决定是否接纳新的服务请求。 ,8.3.2 VOD系统的实例,1. 视频服务器,图8.10 LB - VOD视频服务器结构,2. 客户端程序 LB-VOD的客户端主要是一个基于Linux平台的视频播放器, 它是采用MpegTV SDK开发工具开发的。 MpegTV SDK是一个基于Lniux或 Unix平台的用于开发MPEG-1视频播放程序的工具箱, 它提供一些简单的API函数, 通过这些API函数, 可以访问MpegTV所提供的MPEG视频播放库mtvp, 这样用户就可以根据实际需要方便地开发自己的视频播放器。,LB -VOD的客户端实现了下列功能: 用户登录。用户使用Web浏览器与视频服务器建立连接, 在LB-VOD主页上输入用户名和密码进行用户登录; 节目点播。通过身份认证后可以在给出的节目单上选择点播视频节目; 视频播放。通过权限认证后激活视频播放器, 开始播放所点播的视频节目。在播放过程中, 用户可使用播放器控制按钮进行播放控制(如快进、 快退、 慢放、 暂停等)。 视频播放器内部将周期地向视频服务器报告它所接收到的分组丢失率、 分组延迟及抖动等, 视频服务器将根据客户端的接收报告来调整网络带宽, 对QoS进行自适应管理。,8.4 远程教育系统,现代远程教育应当具有下面五大特征: 教师和学生在地理上是分开的, 不是面对面的; 以现代通信技术、 计算机网络技术和多媒体技术为基础; 具有实时交互式的信息交流功能; 学生可以随时随地上课, 不受时空的限制; 政府行政管理部门对教育机构的资格认证。,1. 系统框架,图 8.11 一个远程教育系统的构造框架,2. 实现方案 (1) 基于Internet的实现方案,图 8.12 基于Internet的桌面远程教育系统,(2) 基于电视广播的实现方案,图8.13 基于电视广播的远程教育系统,(3) 基于多媒体会议的实现方案 这是教室远程教育系统的另一种形式, 整个系统由主播教室、远程教室和通信网络组成, 主播教室中的教师和远程教室的学生之间通过多媒体会议系统进行教学活动, 使之具有双向交互特性, 学生可以借助于视频、 音频和白板等手段向教师提出问题, 教师现场给予解答, 实现一种互动式教学模式, 提高了教学质量和效果。同样, 这种教学模式的通信网络也要采用具有较大网络带宽的无线/有线电视网或宽带电信网来实现, 以支持音频和视频信息的实时传输。,8.5 远程医疗系统,远程医疗(Distance Medicine)是指医疗专业人员利用计算机网络相互交流医学信息, 达到远程诊断、治疗、研究和培训的目的。 作为一种远程医疗系统一般应当包括: 远程诊断、专家会诊、 信息服务、在线检查和远程学习等几个主要部分,在计算机网络的支持下, 以多媒体形式存储、 传输和显示医学信息。,图8.14 远程医疗系统构成,