什么是智能体.docx
《什么是智能体.docx》由会员分享,可在线阅读,更多相关《什么是智能体.docx(9页珍藏版)》请在三一办公上搜索。
1、什么是智能体1、什么是智能体 所谓的Agent,在信息技术尤其是人工智能和计算机领域,可以看作是能够通过传感器感知其环境,并借助于执行器作用于该环境的任何事物。 Multi-Agent系统(MAS) 是指多个Agent成员之间相互协调,相互服务,共同完成一个任务。各Agent成员之间的活动是自治独立的,其自身的目标和行为不受其它Agent成员的限制,它们通过竞争和磋商等手段协商和解决相互之间的矛盾和冲突。MAS主要研究目的是通过多个Agent所组成的交互式团体来求解超出Agent个体能力的大规模复杂问题 2、什么是强化学习 强化学习(reinforcement learning)是人工智能中策
2、略学习的一种, 是一种重要的机器学习方法,又称再励学习、评价学习. 是从动物学习、参数扰动自适应控制等理论发展而来. 所谓强化学习是指从环境状态到动作映射的学习,以使动作从环境中获得的累积奖赏值最大该方法不同于监督学习技术那样通过正例、反例来告知采取何种行为,而是通过试错(trial and error)来发现最优行为策略。常用的强化学习算法包括TD(Temporal Difference)算法、Q学习算法、Sarsa算法等。 3、什么是自组织 如果一个系统靠外部指令而形成组织,就是他组织;如果不存在外部指令,系统按照相互默契的某种规则,各尽其责而又协调地自动地形成有序结构,就是自组织。 自组
3、织现象无论在自然界还是在人类社会中都普遍存在。 一个系统自组织功能愈强,其保持和产生新功能的能力也就愈强。 它的研究对象主要是复杂自组织系统的形成和发展机制问题,即在一定条件下,系统是如何自动地由无序走向有序,由低级有序走向高级有序的。 4、什么是协同进化 两个相互作用的物种在进化过程中发展的相互适应的共同进化。 一个物种由于另一物种影响而发生遗传进化的进化类型。 5、遗传算法 遗传算法是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。 6、什么是学习 学习是智能体适应环境的一种策略。通过和环境进行交互的经验,智能体能够把环境的某
4、些方面综合到其内部状态之中从而形成自身对具体行为应用的认识。 7、什么是进化 进化可以看作是智能体群适应其环境的策略。 8、什么是适应 适应指智能体根据其环境而作出相应调整的学习。适应性允许智能体处理内部与外部传感器的噪声以及它们的环境与其它智能体中的行为的不一致性。 学习、进化与适应使得多智能体系统中的智能体具有通过与其它智能体的竞争与合作改善自身在环境中生存的可能性的能力。 9、什么是人工生命 人工生命(AL:Artificial life)是通过人工模拟生命系统,来研究生命的领域。AL领域着眼于“通常与活的生物体有关的基本现象,譬如自我复制、寄生、进化、竞争与合作”。它试图通过“在计算机
5、、机器人与其他人造系统中模拟或者合成生命的行为”来补充传统的生物与社会科学。 人工生命是来研究具有某些生命基本特征的人工系统。人工生命包括两方面的内容 : 1. 研究如何利用计算技术研究生物现象 2. 研究如何利用生物技术研究计算问题 10、多机器人系统有哪些优点? (1)单个机器人不能完成某些任务,必须依靠多个机器人才能完成。 (2)多机器人系统可以提高工作效率。 (3)机器人的设计有更大的灵活性,完成有限任务的机器人可以设计得更完善。 (4)多机器人系统可以更有效和更精确地进行定位。 (5)多机器人系统中的成员相互协作可以增加冗余度,消除失效点,增加解决方案的鲁棒性。 (6)多机器人系统与
6、单个机器人相比,可以提供更多的解决方案 11、多机器人系统开发中遇到的主要问题? 早期的研究主要以仿真为主,但近来的研究更强调实际的物理实现。美国海军研究部和能源部也对多机器人系统的研究进行了资助。国内在该领域的研究工作很少,只有少数的研究所和大学在进行相关的研究,且大部分的研究工作仍然停留在仿真和实验室阶段。 12、智能体与环境的交互可以描述为一个马尔可夫过程,其依据是什么? 智能体与环境的交互可以描述为一个马尔可夫决策过程。其根据是: 智能体与环境可以建模为同步的有限状态自动机; 智能体与环境在离散时间间隔上进行交互; 智能体能够感知环境的状态,并利用它制定动作; 在智能体作用之后,环境转
7、移到一个新的状态; 智能体在执行一个动作之后得到一个奖励; 13、简述GA算法,流程图 概念同5,遗传算法的主要应用领域:函数优化、组合优化,此外,GA也在生产调度问题、自动控制、机器人学、图象处理、人工生命、遗传编码和机器学习等方面获得了广泛的运用。 流程图: 14、强化学习在实际应用中的困难? 强化学习吸引人的特点之一在于其形式化的基础。如果某个条件满足,智能体将收敛到一个最佳的动作选择策略。不幸的是,这些条件在复杂的环境中几乎无法满足,强化学习有下面几个困难: 不能处理随时间变化的目标,学习到的动作策略是针对一个固定目标集的; 如果目标改变,就不得不重新学习一切 对实际应用来说,状态空间
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 什么是 智能
链接地址:https://www.31ppt.com/p-3256644.html