欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    人工智能第二章.ppt

    • 资源ID:5194352       资源大小:971.50KB        全文页数:35页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    人工智能第二章.ppt

    第二章 智能Agent,内容提要,Agents和环境理性Agent环境的性质Agent的类型与结构,Agent,Agent通过感知器感知环境并通过执行器对所处的环境产生影响人类Agent眼睛,耳朵为感知器手,脚,声道为执行器机器人Agent摄像头,红外距测仪为感知器马达为执行器,Agent和环境,Agent函数将任何感知历史数据映射为行为:Agent程序通过在物理系统上运行来实现Agent函数Agent=体系结构+程序,真空吸尘器世界,感知器:地点和内容(eg.A,Dirty)行为:向左,向右,洗尘,无操作,真空吸尘器世界,理性Agent,理性agent:对于每一可能的感知数据序列,一个理性的agent应该采取一个行为以达到最大的性能。理性判断的4个因素性能度量先验知识可以完成的行动截至到此刻的感知序列,理性Agent,一个Agent应该根据它感知的信息和它能够进行的行为而做正确的事情正确的行为将使得Agent能够取得最大的成功性能度量:一个客观的标准来评价Agent的行为的成功性Eg.真空器agent的性能度量可以是它清洗区域的数量,花费的时间,消耗的能量,产生的噪音等等Eg.真空洗尘器8个小时内清理的灰尘总量来度量性能?以行为来度量性能不如以结果来度量性能,理性Agent,全知:明确知道它的行动产生的实际结果并且作出相应的动作理性不等同于全知(已知的知识都是有限的)理性不等于完美:理性是使期望的性能最大化完美是使实际的性能最大化,理性Agent,理性agent能够进行信息收集。理性的agent应该具有自主性,能够进行学习从环境的感知信息中根据历史经验来学习,任务环境,任务环境:包括性能(Performance),环境(Environment),agent的执行器(Actuators)和传感器(Sensors),英文缩写为PEAS对于每一个智能agent,必须说明其PEAS参数Eg.自动驾驶出租车性能度量环境执行器传感器,任务环境,Eg.自动驾驶出租车性能度量:安全性,快速性,交通违规,舒适度,利润环境:马路,其他交通工具,行人,乘客执行器:方向盘,加速油门,刹车,语音合成器传感器:摄像头,红外或声纳,速度表,GPS,键盘,麦克风,任务环境,Environment:Patient,hospital,staff Actuators:Screen display(questions,tests,diagnoses,treatments,referrals)Sensors:Keyboard(entry of symptoms,findings,patients answers),Eg.医疗诊断系统性能度量:病人的健康性,病人花费环境:病人,医院,工作人员执行器:显示屏(询问,测试,诊断,治疗方案)传感器:键盘(输入症状,现场检测,病人的回答),14,任务环境,Eg.挑拣零件机器人性能度量:正确挑拣的零件所占的百分比环境:零件传送带,容器执行器:机器人手臂和手传感器:摄像头,关节感知器,15,任务环境,Eg.交互式英语教学者性能度量:最大化学生成绩环境:学生执行器:显示屏(练习题,建议,正确答案)传感器:键盘,16,环境的性质,完全可观察的 vs.部分可观察的一个agent的传感器在每个时间点上都能获取环境的完整状态一个agent的传感器在每个时间点上都能获取环境的部分状态真空洗尘器?自动驾驶汽车?单agent vs.多agent单agent独自运行 eg.字谜游戏多agent同时运行 eg.国际象棋国际象棋 vs.驾驶出租车?,环境的性质,确定的 vs.随机的环境的下一个状态完全取决于当前状态和agent执行的动作部分可观察?出租车驾驶?真空吸尘器?片段式的 vs.延续式的agent的经历被分成一个个原子片段,在每个片段中agent感知信息并完成单个行动,下一个片段不依赖于以前的片段检查次品零件的机器人?国际象棋?,18,环境的性质,静态的 vs.动态的环境在agent计算的时候不会变化(vs.会变化)半动态的:环境本身不变化但agent的性能评价随时间变化出租车,国际象棋,填字游戏?离散的 vs.连续的环境的状态,时间的处理方式以及agent的感知信息和行动都有离散/连续之分国际象棋,出租车驾驶?,环境的性质,环境的性质决定了agent的设计最难处理的情况:部分可观察的,随机的,连续的,动态的,延续式的,多agent的,Agent函数和程序,一个agent用agent函数来表示agent函数将感知数据序列映射为行为 Agent程序以传感器得到的当前感知信息为输入以执行器的行动为输出仅仅以当前感知为输入而不是以整个历史感知为输入,Agent的表驱动方法,缺点表太大创建表时间长非自主性,需人工填写即使能够学习,也需要很长的时间,Agent的类型,四种基本的类型简单反射agent基于模型的反射agent基于目标的agent基于效用的agent,真空吸尘器的Agent程序,简单反射的agent,基于当前的感知选择行动,不关注感知历史,简单反射的agent,环境是完全可观察的还是部分可观察的?,Eg.真空吸尘器问题,刹车问题,基于模型的反射agent,Agent根据感知历史维持内部状态Agent随时更新内部状态信息,基于模型的反射agent,基于目标的agent,除了根据感知信息之外,还要根据目标信息来选择行动效率比较低,需要推理搜索和规划算法,基于目标的agent,基于效用的agent,当达到目标的行为有很多种的时候,需要考虑效率环境是部分可观察的和随机的,不确定下的决策过程可以通过基于效用的agent来实现。效用的作用多目标相冲突时多目标在不确定环境中一个目标有多种行为可以达到时,基于效用的agent,学习agent,学习agent,4个组件性能元件:相当于整个agent评判元件:反映性能元件做得如何学习元件:负责改进提高问题产生器:提出一些新的有建设性的探索尝试Eg.出租车行驶,总结,Agents和环境理性Agent环境的性质Agent的类型与结构,Qa?,

    注意事项

    本文(人工智能第二章.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开