多媒体虚拟现实及人工智能.ppt

上传人：小飞机

文档编号：6560941

上传时间：2023-11-12

格式：PPT

页数：97

大小：273KB

《多媒体虚拟现实及人工智能.ppt》由会员分享，可在线阅读，更多相关《多媒体虚拟现实及人工智能.ppt（97页珍藏版）》请在三一办公上搜索。

1、3.3 网络多媒体技术及应用,计算机网络与多媒体技术,网络多媒体技术及应用,多媒体关键技术,1 数据压缩概述,由于多媒体数据量非常大，造成计算机的存储和网络传输负担若帧速率为25帧秒，则1s的数据量大约为25MB，一个640MB的光盘只能存放大约25s的动态图像一幅640480分辨率的24位真彩色图像的数据量约为900KB；一个100MB的硬盘只能存储约100幅静止图像画面解决办法之一就是进行数据压缩，压缩后再进行存储和传输，到需要时再解压、还原。以目前常用的位图格式的图像存储方式为例，像素与像素之间无论是在行方向还是在列方向都具有很大的相关性，因而整体上数据的冗余度很大，在允许一定限度失真的

2、前提下，能够对图像数据进行很大程度的压缩。,数据压缩方法无损压缩：利用数据的统计冗余进行压缩，可完全恢复原始数据而不引入任何失真，但压缩率受到统计冗余度理论限制，一般为2：1到5：1。无损压缩所使用的编码技术常使用熵编码，它把已压缩的数据流看做是简单的数字序列，而忽略该数据的语义，适用于不必考虑其自身具体特点的媒体。常用工具：WinRar、WinZip、ARC等,1 数据压缩概述,行程编码,多数无损压缩采用行程编码。行程编码又称“运行长度编码”或“游程编码”，是一种统计编码，该编码属于无损压缩编码。行程编码的基本原理是：用一个符号值或串长代替具有相同值的连续符号算法。连续符号构成了一段连续的“

3、行程”。行程编码因此而得名，使符号长度少于原始数据的长度。例如：5555557777733322221llllll行程编码为：（5，6）（7，5）（3，3）（2，4）（l，7）。可见，行程编码的位数远远少于原始字符串的位数。,1 数据压缩概述,数据压缩方法有损压缩：利用了人类视觉和听觉器官对图像或声音中的某些频率成分不敏感的特性，允许在压缩过程中损失一定的信息；虽然不能完全恢复原始数据，但是所损失的部分对理解原始图像或声音的影响较小，却换来了大得多的压缩比。有损压缩广泛应用于语音、图像和视频数据的压缩。常用的有损压缩编码技术为源编码（考虑原始数据的语义）和混合编码（熵编码和源编码技术）。常用工

4、具：JPEG、MPEG等,1 数据压缩概述,衡量一种数据压缩技术的好坏有三个重要的指标压缩比图像质量或音质压缩和解压的速度数据压缩原理原始的多媒体信源数据存在着客观上的大量冗余。信息理论认为：若信源编码的熵大于信源的实际熵，该信源中一定存在冗余度。去掉冗余不会减少信息量，仍可原样恢复数据；但若减少了熵，数据则不能完全恢复。不过在允许的范围内损失一定的熵，数据仍然可以近似恢复。,1 数据压缩概述,数据压缩原理因为人的感觉的某些不敏感性，多媒体数据中还存在着从主观感受角度看去的大量冗余，即：在人眼允许的误差范围之内，压缩前后的图像如果不做非常细致的对比是很难觉察出两者的差别的。,1 数据压缩概述,

5、数据压缩技术标准H.261：是为在综合业务数字网（ISDN）上开展双向声像业务（可视电话、视频会议）而制定的，速率为64kb/s的整数倍。它使用两种类型的压缩：一帧中的有损压缩和帧间压缩的无损编码，并在此基础上使编码器采用带有运动估计的DCT和DPCM（差分脉冲编码调制）的混合方式，H.261是最早的运动图像压缩标准。,音频信号压缩编码的主要依据是人耳的听觉特性，主要有两点：1.人的听觉系统中存在一个听觉阈值电平，低于这个电平的声音信号人耳听不到.次声、可听声和超声 2.人的听觉存在屏蔽效应。当几个强弱不同的声音同时存在时，强声使弱声难以听到，并且两者之间的关系与其相对频率的大小有关.声音编码

6、算法就是通过这些特性来去掉更多的冗余数据，来达到压缩数据的目的。,2 音频数据的压缩,在多媒体中，音频有很多压缩编码标准：（1）MP3音频 MP3的全名是MPEG Audio Layer-3，简单地说就是一种声音文件的压缩格式。是目前最普及的音频压缩格式，是典型的有损压缩。MPEG-1音频压缩标准里包括了三个使用高性能音频数据压缩方法的感知编码方案，按照压缩质量(每Bit的声音效果)和编码方案的复杂程度分别是Layer1、Layer2、Layer3。,2 音频数据的压缩,MPEG-1音频的层次与压缩比率,MP3是利用 MPEG Audio Layer 3 的技术，将音乐以1:10 甚至 1:1

7、2 的压缩率，压缩成容量较小的文件，能够在音质丢失很小的情况下把文件压缩到更小的程度。每分钟音乐的MP3格式只有1MB左右大小，这样每首歌的大小只有3-4兆字节。而且还非常好的保持了原来的音质。使用MP3播放器对MP3文件进行实时的解压缩(解码)，这样，高品质的MP3音乐就播放出来了。,MP3音频,（2）MP3PRO MP3PRO，它是 Thomson Multimedia多媒体公司推出的一个MP3格式的升级版本，MP3PRO可以把声音文件压缩到原有MP3格式的一半大小，但却可以保持相同的音质。,2 音频数据的压缩,2.MP3PROMP3PRO文件在播放上完全与MP3兼容，经过mp3Pro压缩

8、的文件，扩展名仍旧是.mp3 也就是说，老的MP3文件可以在新的MP3PRO播放器上进行播放，同时，新的MP3PRO可以在标准的MP3软件和设备上播放，但效果可能较差，因为两者录制方式不同。mp3pro在相应的播放软件中才能达到最高音质，而且mp3pro的制作比较麻烦，目前还没有批量压制的好方法。,2 音频数据的压缩,音频数据的压缩,mp3PRO Audio Player mp3PRO音乐文件的播放、制作功能,3.WMA WMA(Windows MediaAudio)格式是来自于微软的重量级选手，后台强硬，音质要强于MP3格式，更远胜于RA格式，它是以减少数据流量但保持音质的方法来达到比MP3

9、压缩率更高的目的，WMA的压缩率一般都可以达到1：18左右.,2 音频数据的压缩,4.WMA WMA还支持音频流技术，适合在网络上在线播放，更方便的是不用象MP3那样需要安装额外的播放器，而Windows操作系统和WindowsMediaPlayer的无缝捆绑让你只要安装了windows操作系统就可以直接播放WMA音乐，新版本的WindowsMediaPlayer7.0更是增加了直接把CD光盘转换为WMA声音格式的功能，在新出品的操作系统WindowsXP中，WMA是默认的编码格式.音质好的可与CD媲美，压缩率较高,可用于网络广播。,2 音频数据的压缩,5.WAVE WAV格式是微软公司开发的

10、一种声音文件格式，也叫波形声音文件，是最早的数字音频格式，被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法，支持多种音频位数、采样频率和声道，采用44.1kHz的采样频率，16位量化位数，因此WAV的音质与CD相差无几，但WAV格式对存储空间需求太大不便于交流和传播,2 音频数据的压缩,3 静态图像的数据压缩,静态图像压缩技术主要是对空间信息进行压缩，目的是在满足一定图像质量的条件下，缩小图像文件所占用的存储空间，从而减小存储容量和占用尽量小的网络带宽。,JPEG标准国际标准化组织(ISO)和国际电报电话咨询委员会(CCITT)联合成立的“联合图像专家组”JPEG(Joi

11、nt Photograph coding Experts Group)于1991年提出的“多灰度静止图像的数字压缩编码”(简称JPEG标准)。这是一个适应于彩色和单色多灰度或连续色调静止数字图像的压缩标准，是最常用的图像文件格式，是一种有损压缩，压缩比很大。,3 静态图像的数据压缩,4 运动图像的数据压缩,视频：运动图像即静止图像的连续播放状态压缩目标：尽可能保证视觉效果的前提下减少视频数据率。压缩比：压缩后的数据量与压缩前的数据量之比。运动图像的数据压缩方法有损和无损压缩帧内和帧间压缩对称和不对称压缩,MPEG(运动图像专家组Moving Pictures Experts Group

12、)标准是一系列视频、音频、数据的压缩标准。分成MPEG视频、MPEG音频和MPEG系统三大部分。MPEG算法除了对单幅图像进行编码外(帧内编码)，还利用图像序列的相关特性去除帧间图像冗余，大大提高了视频图像的压缩比。,4 运动图像的数据压缩,4 运动图像的数据压缩,压缩的基本方法：在单位时间内采集并保存第一帧信息，然后就只存储其余帧相对第一帧发生变化的部分，以达到压缩的目的。MPEG压缩标准可实现帧之间的压缩。压缩比可达到50:1，同时图像和音频的质量也非常高。,最初MPEG专家组的工作项目是3个，即在1.5Mbps，l0Mbps，40Mbps传输速率下对图像编码，分别命名为MPEG-1，MP

13、EG-2，MPEG-3。l992年，MPEG-2适用范围扩大到HDTV（高清晰数字电视输出技术），能支持MPEG-3的所有功能，因而MFEG-3被取消。主要有：MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21,4 运动图像的数据压缩,MPEG-1 标准MPEG-1即“用于数字存储媒体运动图像及其伴音速率为1.5Mbps的压缩编码”,于1992年正式出版。MPEG-1提供每秒30帧352*240分辨率的图像，MPEG-1 是VCD视频的压缩标准。MPEG-1的任务主要是，将视频信号及其伴音以可接收的重建质量压缩到约1.5Mbps的码率，并复合成一个单一的MPEG位流，同时保

14、证视频和音频的同步。,4 运动图像的数据压缩,MPEG-2标准 MPEG-2标准于1994年公布，包括系统部分、视频部分、音频部分及符合性测试部分。MPEG-2编码标准希望囊括数字电视、图象通信各领域的编码标准，MPEG-2按压缩比大小的不同分成五个档次(profile)，每一个档次又按图象清晰度的不同分成四种图象格式，或称为级别(level)。五个档次四种级别共有20种组合，但实际应用中有些组合不太可能出现，较常用的是11种组合。MPEG-2 是DVD视频的压缩标准。每秒30帧704*480的分辨率,4 运动图像的数据压缩,MPEG-4 标准 MPEG-4标准于1998年公布，是为了播放流式

15、媒体的高质量视频而专门设计的，它可利用很窄的带度，采用了全新的压缩理念，通过帧重建技术，压缩和传输数据，以求使用最少的数据获得最佳的图像质量，并将之作为网络上传送之用。MPEG-4 可把DVD内MPEG-2的视频文件转换为体积更小的文件。还包含了以前MPEG压缩标准所不具备的比特率的可伸缩性、动画精灵、交互性甚至版权保护等一些特殊功能。,4 运动图像的数据压缩,RM/RMVB RM(Real Media)是RealNetworks公司所制定的音频视频压缩规范，是一种流媒体格式。用户可以使用RealPlayer或RealOne Player对符合RealMedia技术规范的网络音频/视频资源进行

16、实况转播，并且RealMedia还可以根据不同的网络传输速率制定出不同的压缩比率，从而实现在低速率的网络上进行影像数据实时传送和播放。这种格式的另一个特点是用户使用RealPlayer播放器可以在不下载音频/视频内容的条件下实现在线播放。,4 运动图像的数据压缩,多媒体数据压缩编码小结,多媒体数据压缩的必要性和可能性多媒体数据压缩技术及其标准多媒体数据压缩的技术指标常用多媒体数据压缩标准,流媒体技术及应用,1流媒体技术原理2流媒体制作3流媒体课件制作4流媒体技术网络教育应用方案,流媒体基本概念,流媒体基本概念流媒体指在internet/intranet中使用流式传输技术的连续时基媒体，

17、如：音频、视频或多媒体文件，它在播放前并不下载整个文件，只将开始部分内容存入内存，其他的数据流随时传送随时播放，只是在开始时有一些延迟，其关键技术就是流式传输。,关键技术压缩编码技术压缩编码的基本原理是采用一定的编码方式，将文件的数据结构进行重组。一方面，去掉一些重复或占而不用的空间，以达到减小文件尺寸的目的；另一方面，将文件分成压缩包，形成数据流，将原有的多媒体文件转化为具有流格式的流媒体。,流媒体特点,流媒体具有明显的优点:（1）由于不需要将全部数据下载，等待时间可以大大缩短；（2）由于流文件往往小于原始文件的数据量，并且用户也不需要将全部流文件下载到硬盘，节省了大量的磁盘空间；（3）由

18、于采用了rstp等实时传输协议，更加适合动画、视音频在网上的实时传输。,流媒体技术原理,流式传输时，声音、影像或动画等时基媒体由音视频服务器向用户计算机的连续、实时传送，用户只需经过几秒或十几秒的启动延时即可进行观看。当声音等时基媒体在客户机上播放时，文件的剩余部分将在后台从服务器内继续下载。流式传输不仅使启动延时大大缩短，而且不需要过多的缓存，从而避免了用户必须等待整个文件全部从internet上下载才能观看的缺点。,流媒体技术原理,流式传输的定义很广泛，现在主要指通过网络传送媒体（如视频、音频）的技术总称，其特定含义为通过internet 将影视节目传送到pc机。实现流式传输有两种方法：实

19、时流式传输（realtime streaming）和顺序流式传输（progressive streaming）。一般说来，如视频为实时广播，或使用流式传输媒体服务器，或应用如rtsp的实时协议，即为实时流式传输。如使用http服务器，文件即通过顺序流发送。当然，流式文件也支持在播放前完全下载到硬盘。,流媒体技术原理,顺序流式传输顺序流式传输是顺序下载，在下载文件的同时用户可观看再线媒体，在给定时刻，用户只能观看已下载的那部分，而不能跳到还未下载的前头部分，顺序流式传输不象实时流式传输在传输期间根据用户连接的速度做调整。由于标准的http服务器可发送这种形式的文件，也不需要其他特殊协议，它经常

20、被称作http流式传输。,流媒体技术原理,实时流式传输实时流式传输指保证媒体信号带宽与网络连接配匹，使媒体可被实时观看到。实时流与http流式传输不同，需要专用的流媒体服务器与传输协议。实时流式传输总是实时传送，特别适合现场事件，也支持随机访问，用户可快进或后退以观看前面或后面的内容。理论上，实时流一经播放就可不停止，但实际上，可能发生周期暂停。,流媒体技术原理,实时流式传输必须配匹连接带宽，实时流式传输需要特定服务器，如quicktime streaming server、realserver与windows media server.这些服务器允许对媒体发送进行更多级别的控制，因而系统设

21、置、管理比标准http服务器更复杂。实时流式传输还需要特殊网络协议，如：rtsp（realtime streaming protocol）或mms（microsoft media server）。,流媒体的系统组成及网络环境,流媒体的系统组成编码工具：用于创建、捕捉和编辑多媒体数据，形成流媒体格式，这可以由带视音频硬件接口的计算机和运行其上的制作软件共同完成。流媒体数据。服务器：存放和控制流媒体的数据。网络：适合多媒体传输协议或实时传输协议的网络。播放器：供客户端浏览流媒体文件。,支持流媒体传输的网络协议,流式传输的实现需要合适的传输协议。由于tcp需要较多的开销，故不太适合传输实时数据。在

22、流式传输的实现方案中，一般采用http/tcp来传输控制信息，而用rtp/udp来传输实时声音数据。,支持流媒体传输的网络协议,实时传输协议rtp与实时传输控制协议rtcp 实时传输协议rtp（real-time transport protocol）是用于internet上针对多媒体数据流的一种传输协议。rtp通常使用udp来传送数据，但rtp也可以在tcp或atm等其他协议之上工作。,支持流媒体传输的网络协议,实时传输控制协议rtcp（real-time transport control protocol）rtp一起提供流量控制和拥塞控制服务。在rtp会话期间，各参与者周期性地传送rtc

23、p包。rtcp包中含有已发送的数据包的数量、丢失的数据包的数量等统计资料，因此，服务器可以利用这些信息动态地改变传输速率，甚至改变有效载荷类型。rtp和rtcp配合使用，它们能以有效的反馈和最小的开销使传输效率最佳化，因而特别适合传送网上的实时数据。,支持流媒体传输的网络协议,资源预订协议rsvp 由于音频和视频数据流比传统数据对网络的延时更敏感，要在网络中传输高质量的音频、视频信息，除带宽要求之外，还需其他更多的条件。rsvp（resource reserve protocol）是正在开发的internet上的资源预订协议，使用rsvp预留一部分网络资源（即带宽），能在一定程度上为流媒体的传

24、输提供qos.在某些试验性的系统如网络视频会议工具vic中就集成了rsvp.,2流媒体制作,（1）realproducer_plus_111_windows_setup（2）Microsoft_Producer_2003,3流媒体课件制作,视频转换大师(WinMPG Video Convert）狸窝,流媒体技术的网络教育应用方案,（1）实时同步教学方式的实现,视音频信号网络传输,功率放大,流媒体技术的网络教育应用方案,（2）异步教学方式的实现异步教学方式的实现需要将制作好的流媒体课件放在网上供学生随时浏览学习。以时间流程的实现和过程控制见长。声画同步。,5.2 多媒体虚拟现实技术,虚拟现实V

25、irtual Reality，VR，是20世纪80年代末90年代初崛起的一种实用技术虚拟现实是多媒体技术发展的更高境界在Internet、军事、医学、教育、商业、建筑设计、娱乐甚至农业领域得到应用,虚拟现实基本概念,定义：虚拟现实是一种人与通过计算机生成的虚拟环境之间可自然交互的人机界面。,多媒体虚拟现实技术,虚拟现实的基本特征浸入性：用户感到被虚拟世界包围，就好像完全融入其中一样视觉浸入：使用者可以亲身体验虚拟环境真实直观的试图触觉浸入：允许使用者接触并感觉虚拟物体听觉浸入：模拟人耳感受声音方式，提供真实声音嗅觉浸入、味觉浸入：刚刚开始或尚未开始研究交互性：用户能通过自然的动作与虚拟世界的物

26、体进行交互作用构想性：在虚拟现实系统中，帮助人们获取知识和形成新的概念,多媒体虚拟现实技术,虚拟现实的发展1929年，Edwin Link设计了第一台使乘坐者具有飞机中飞行感觉的乘坐器1990年，在美国达拉斯召开的Siggraph会议，明确提出VR的主要内容：实时三维图形生成技术多传感器交互技术高分辨率现实技术东北大学信息科学与工程学院人工智能与机器人研究所进行虚拟现实研究，其研制的足球机器人“牛牛”在国际大赛上多次获奖,多媒体虚拟现实技术,虚拟现实的主要研究内容人与环境融合技术高分辨率立体显示器方位跟踪系统：记录演员三维形体动作手势跟踪系统：数据手套触觉反馈系统声音定位与跟踪系统物体对象的仿

27、真技术几何仿真：快速建立不同层次的现实模型物理仿真行为仿真：在用户操作下或在其他景物的作用下场景状态的变化规律和变化过程,多媒体虚拟现实技术,虚拟现实系统的基本组成虚拟世界、虚拟现实软件、计算机、输入设备和输出设备五大部分,输入设备,输入设备,虚拟现实软件,虚拟世界,计算机,多媒体虚拟现实技术,虚拟世界：可以交互的虚拟环境虚拟现实软件：提供实时观察和参与虚拟世界的能力虚拟环境建模：CAD、3DS动画制作、物理仿真、碰撞检测、交互模式输入输出设备,多媒体虚拟现实技术,虚拟现实应用科学研究和科学计算可视化工程应用商业应用军事应用医学应用教育培训娱乐应用,VRML技术简介,VRML(Virtual

28、Reality Modeling Language)即虚拟现实建模语言,是一项和多媒体通讯、因特网、虚拟现实等领域密切相关的新技术,用来描述一个目标对象是如何呈现在Web上的。和HTML一样,VRML也是可由浏览器解释的描述语言,只不过VRML不是描述成一个Page 的格式,而是描述成3D环境和目标的布局。它的主要特征有三维性、交互性、动态性、实时性等。,VRML 基本工作原理,用文本信息描述三维场景,在Internet网上传输,在本地机上由VRML的浏览器解释生成三维场景,解释生成的标准规范即是VRML规范。,VRML的基本特性,平台无关性；网络传输高速性；实时性；可扩充性,VRML的建模,

29、VRML语言具有的基本物体有:球体、锥体、柱体、立方体和文本等,这些基本物体为创建景像提供了方便。VRML的语法虽然并不复杂,但比较烦琐,如果需要设计房间内的装饰不仅需要设置各种器材的材质,还需要设置相应的位置,因此其代码量是相当可观的,因而目前有许多创建VRML文件模型的软件,可以把其它三维格式的文件转换成VRML文件,如3DSMAX、RAW 等。但是若采用上述软件完成的三维模型都是手工在各个视图中绘制出来的,费时费力,而且不够真实准确,对于那些需要采用大量数据来准确描述构造物时,或者被描述的这些物体非常不规则,则很难用手工精确创制。,虚拟现实开发工具Vrml Pad,Vrml Pad是一种

30、功能强大且简单好用的VRML开发设计专业软件，通过VrmlPad可以对VRML文件进行浏览编辑，对资源文件进行有效的管理，并且提供了VRML文件发布向导，可以帮助开发人员编写和发布自己的VRML虚拟现实作品。另外，它提供的插件功能也能方便地完成VRML模型创建。,下面举一个用VRML创建一红色球体的例子：#VRML V2.0 utf8#VRML文件的标准头Transform children NavigationInfo headlight FALSE#加入自己的灯光DirectionalLight#灯光direction 0 0-1Transform#定义字节点translation 3 0

31、 1 children Shape appearance Appearance#球体外观定义material Material diffuseColor 1 0 0 geometry Sphere radius 2.3#球体#Transform节点结束#VRML世界的子节点定义结束#整个VRML文件结束,5.3 Agent 技术,1什么是Agent 2 Agent的类型3 Agent的结构4 多Agent系统5 Agent的实现工具6 Agent技术的发展与应用7 智能机器人简介,什么是Agent,Agent一词的主要意思是“代理（人）”，但我们这里的Agent还具有更多的含义。简单来说，A

32、gent是一种实体，而且是一种具有智能的实体。Agent技术来源于分布式人工智能DAI领域。也有人将其翻为智能主体或智能体。,什么是Agent,Hewitt认为Agent技术是一种处于一定环境下包装的计算机系统，为实现设计目的，能在该环境下灵活的，自主的活动。在1995年Wooldrige给出了Agent的两中定义：（弱定义）Agent用以最一般的说明一个软硬件系统，它具有这样的特性：自治性，社会性，反映性，能动性；（强定义）Agent除了具备弱定义中的所有特性外，还应具备一些人类才具有的特性，如知识，信念，义务，意图等。,什么是Agent,Agent除了具备弱定义中的所有特性外，还应具备一些

33、人类才具有的特性，如知识，信念，义务，意图等。,Agent产生背景,Agent技术在90年代成为热门话题,甚至被一些文献称为软件领域下一个意义深远的突破,其重要原因之一在于,该技术在基于网络的分布计算这一当今计算机主流技术领域中,正发挥着越来越重要的作用。一方面,Agent技术为解决新的分布式应用问题提供了有效途径;另一方面,Agent技术为全面准确地研究分布计算系统的特点提供了合理的概念模型。,Agent产生背景,常规的分布计算技术是基于经典的客户/服务器计算模型的,即将分布式应用分解为客户和服务器两大部分,服务器只有在接到客户的请求后方能提供服务。这些技术是在共享分布资源的应用背景下形成的

34、,在解决新的分布式应用方面存在诸多局限性。,Agent产生背景,从人找信息到信息找人“客户/服务器计算模型使得通过Internet进行信息分布和查找的应用存在以下问题:一方面,信息提供者不能适时地将信息主动提供给最需要的用户;另一方面,信息使用者不知道到哪里能够找到急需的信息。2.并行工程各环节之间仍存在着数据共享和部门协同的沟痕,影响了产品设计制造的整体进度和质量。3.分布式交互仿真单一仿真器的应用局限性很大,Agent产生背景,常规的分布计算技术的局限源于经典的客户/服务器计算模型的局限,即:将分布式应用中的自主行为实体简单地划分为客户和服务器两类;客户与服务器之间的交互关系仅限于客户

35、主动请求/服务器被动响应的非对等关系。,Agent产生背景,1.利用Agent技术改善Internet应用例如,研制“信息找人”的Agent。2.利用Agent技术实现并行工程的思想例如,利用Agent技术开发工作流管理者。3.利用Agent技术开发分布式交互仿真环境将飞行训练仿真器与计算机网络上的若干工作站连接起来,在工作站上实现多个模拟飞机的Agent,与仿真器构成可交互的空战仿真环境。受训人员操作这种置于交互仿真环境中的仿真器,不仅能够体验各种操纵飞机的技能,而且能够通过与智能化的自主模拟战机的交互,实践各种空战战术行为,Agent基本特性,Agent的抽象模型是具有传感器和效应器，

36、处于某一环境中的实体。它通过传感器感知环境；通过效应器作用于环境；它能运用自己所拥有知识进行问题求解；它还能与其它Agent进行信息交流并协同工作。因此，Agent应具有如下基本特性：(1)自主性亦称自治性，即能够在没有人或别的Agent的干预下，主动地自发地控制自身的行为和内部状态，并且还有自己的目标或意图。,(2)反应性即能够感知环境，并通过行为改变环境。(3)适应性即能根据目标、环境等的要求和制约作出行动计划，并根据环境的变化，修改自己的目标和计划。(4)社会性，一个Agent一般不能在环境中单独存在，而要与其它Agent在同一环境中协同工作。而协作就要协商，要协商就要进行信息交流

37、，信息交流的方式是相互通信。,Agent的概念由Minsky在其1986年出版的思维的社会一书中提出。Minsky认为社会中的某些个体经过协商之后可求得问题的解，这些个体就是Agent。他还认为Agent应具有社会交互性和智能性。从此，Agent的概念便被引入人工智能和计算机领域，并迅速成为研究热点。,教育的Agent的一般构成,教学Agent：教学策略Agent，学生建模，教学内容，测验和评价，协调。接口Agent：负责学习者与系统内部的信息交流以及和其他系统的接口Agent的交流。过程管理Agent：监控学习过程，收集分析数据，为教学决策Agent采取策略。,Agent的类型,从Agent

38、理论模型角度来看，Agent可分为反应型、思考型（或认知型）和两者复合型。从特性来看，Agent可分为以下几种类型：(1)反应式Agent。这种Agent能够对环境主动进行监视，并能做出必要的反应。反应式Agent最典型的应用是机器人，特别是Brookes类型的机器昆虫。,(2)BDI型Agent。即有信念（Belief，即知识）、愿望（Desire，即任务）和意图（Intention，即为实现愿望而想做的事情）的Agent。它也被称为理性Agent。这是目前关于Agent的研究中最典型的智能型Agent，或自治Agent。BDIA gent的典型应用是在Internet网上为主人收集信息的软

39、件Agent。比较高级的智能机器人也是BDI Agent。,(3)社会Agent 是处在由多个Agent构成的一个Agent社会中的Agent。各Agent有时有共同的利益（共同完成一项任务），有时利益互相矛盾（争夺一项任务）。因此，这类Agent的功能包括协作和竞争。办公自动化Agent是协作的典型例子，多个运输（或电信）公司Agent争夺任务承包权是竞争的典型例子。,(4)演化Agent 具有学习和提高自己能力的Agent。单个Agent可以在同环境的交互中总结经验教训，提高自己的能力。但更多的学习是在多Agent系统，即社会Agent之间进行的。模拟生物社会（如蜜蜂和蚂蚁）的多Agent

40、系统是演化Agent的典型例子。(5)人格化Agent 不但有思想，而且有情感的Agent。这类Agent研究得比较少，但是有发展前景。在故事理解研究中的故事人物Agent是典型的人格化Agent。,Agent的结构,由于Agent的多样性，很难给出一个统一的结构模型。下面仅给出思考型Agent的一个简单结构模型（见图1）。,图1 思考型Agent结构模型示意图,多Agent系统,从Agent的特性可以看出，Agent的一个显著特点就是它的社会性。所以，Agent的应用主要是以多个Agent协作的形式出现。因而多Agent系统（简称MAS）就成为Agent技术的一个重点研究课题。另一方面，MA

41、S又与分布式系统密切相关，所以，MAS也是分布式人工智能（DAI）的基本内容之一。,1.多Agent系统的特征多Agent系统是一个松散耦合的Agent网络，这些Agent通过交互、协作进行问题求解（所解问题一般是单个Agent能力或知识所不及的）。其中的每一个Agent都是自主的，它们可以由不同的设计方法和语言开发而成的，因而可能是完全异质的。多Agent系统具有如下特征：(1)每个Agent拥有解决问题的不完全的信息或能力；(2)没有系统全局控制；(3)数据是分散的；(4)计算是异步的。,2.多Agent系统的研究内容多Agent系统的理论研究是以单Agent理论研究为基础的，所以，除

42、单Agent理论研究所涉及的内容外，多Agent系统的理论研究还包括一些和多Agent系统有关的基本规范，主要有以下几点：(1)多Agent系统的定义；(2)多Agent系统中Agent心智状态包括与交互有关的心智状态的选择与描述；(3)多Agent系统的特性以及这些特性之间的关系；(4)在形式上应如何描述这些特性及其关系；(5)如何描述多Agent系统中Agent之间的交互和推理。,3.多Agent系统的体系结构多Agent系统的体系结构可以是以下几种：(1)Agent网络 Agent之间都是直接通信的。对这种结构的Agent系统，通信和状态知识都是固定的，每个Agent必须知道消息应该在

43、什么时候发送到什么地方，系统中有哪些Agent是可以合作的，都具备什么样的能力等。,(2)Agent联盟结构不同于Agent网络，其工作方式是：若干相距较近的Agent通过一个叫做协助者的Agent来进行交互，而远程Agent之间的交互和消息发送是由各局部Agent群体的协助者Agent协作完成的。(3)黑板结构和联盟系统有相似之处，不同的地方在于黑板结构中的局部Agent把信息存放在可存取的黑板上，实现局部数据共享。,Agent的实现工具,Agent的实现（即编程）工具可分为两类：一类是专用的面向Agent的程序语言，另一类则是现有的通用面向对象程序语言（或其扩充）。已知的专用Agent

44、编程语言有Agent描述语言ADL、Agent处理控制语言PCL和Agent通信语言SACL（中科院计算所开发史忠植，1998年）、AGENT0、PLACA,（PLAnning Communicating Agentlanguage Thomas1993）、KQML（Knowledge Queryand Manipulation Language，国际上比较流行的Agent通信语言，美国ARPA的知识共享计划的一部分）等。,Agent技术的发展与应用,Agent技术是一种新的智能技术，关于它的研究方兴未艾。目前的热点课题主要是Agent的理论模型、多Agent系统及其开发应用。Agent的理论

45、模型的研究主要有逻辑方法和经济学方法两种。上面提到的BDI型Agent就是基于逻辑方法而提出的一种Agent模型，被称为理性Agent。多Agent系统的主要课题是其问题求解机制，包括组织形式、协商协调机制、学习机制等有关的理论和方法学。,Agent技术虽然是一种新的智能技术，但它与传统的人工智能技术并不是截然分开的。事实上，Agent技术与传统的人工智能技术是互相渗透、相辅相成的。一方面，在Agent的设计中要用到许多传统的人工智能技术，如模式识别、机器学习、知识表示、机器推理、自然语言理解等；另一方面，有了Agent概念以后，传统的人工智能技术又可在Agent技术的支持下，提高到一个新的水

46、平。,智能机器人简介,1.智能机器人的概念一般将机器人的发展分为3个阶段。第一阶段的机器人只有“手”，以固定程序工作，不具有外界信息的反馈能力；第二阶段的机器人具有对外界信息的反馈能力，即有了感觉，如力觉、触觉、视觉等；第三阶段，即所谓“智能机器人”阶段，这一阶段的机器人已经具有了自主性，有自行学习、推理、决策、规划等能力。这也正符合Agent的条件，所以，现在把智能机器人也作为一种Agent。,2.机器人感知机器人的感知包括对外界和对自身的感知。感知机能是靠传感器来实现的。因而，机器人传感器可分为内部传感器和外部传感器两大类。内部传感器用来感知机器人的内部状态信息，包括关节位置、速度、加

47、速度、姿态和方位等。,3.机器人规划机器人规划也称机器人问题求解。感知能力使机器人能够感知对象和环境，但要解决问题，即产生适应对象和环境的动作，还要依靠规划功能。规划就是拟定行动步骤。实际上它就是一种问题求解技术，即从某个特定问题的初始状态出发，寻找或构造一系列操作（也称算子）步骤，达到解决问题的目标状态。,4.机器人控制机器人控制即运动控制，包括位置控制和力控制。位置控制就是对于路径规划给出的运动轨迹（即路径），控制机器人的肢体（如机械手）产生相应的动作。力控制则是对机器人的肢体所发出的作用力（如机械手的握力和推力）大小的控制。运动控制涉及机器人的运动学和动力学特性，所以，运动控制研究需要许多运动学和动力学知识。,5.机器人语言“教”机器人完成有关作业称为程序设计。这种程序设计一般有三种方式：直接示教方式、离线数据程序设计方式和使用机器人语言方式。直接示教方式，也称示教再现方式。即使用示教盒根据作业的需要把机器人的手爪送到作业所需要的位置上去，并处于所需要的姿态，然后把这一位置、姿态存储起来。对作业空间的各轨迹点重复上述操作，机器人就把整个作业程序记忆了下来。工作时，再现上述操作就能使机器人完成预定的作业，同时可以反复同样的作业过程。,