深度强化学习与机器人控制.pptx
《深度强化学习与机器人控制.pptx》由会员分享,可在线阅读,更多相关《深度强化学习与机器人控制.pptx(16页珍藏版)》请在三一办公上搜索。
1、深度强化学习与机器人控制,强化学习(reinforcement Learning,rl),Agent通过与环境交互学习一个从环境状态到行为的映射,学习的目标是使累积折扣奖赏最大。可用Markov决策过程描述,四个元素:S、A、P、R,深度强化学习(Deep reinforcement Learning,Drl)从感知到控制,结合深度学习的感知能力和强化学习的决策能力,直接从高维原始数据学习控制策略。解决了强化学习的1.函数逼近器:连续状态到连续动作空间映射问题;2.end to end:高维数据直接到动作的映射发展:Q-learningDQNPolicy Gradient:end to end
2、Deep Deterministic Policy GradientAction network,Critic network,1 Mnih,Volodymyr,et al.Human-level control through deep reinforcement learning Nature 518.7540(2015),深度强化学习能干什么,(棋类)游戏自动驾驶飞行器控制机械臂操作多足行走,深度强化学习能干什么(对于我们),动目标捕获(在轨服务,工业,娱乐)自主装配(在轨构建,工业)自动驾驶、导航(星表探测)多目标识别(在轨监测)设计师助手,DRL应用于机器人控制的步骤,1.设计算法2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 深度 强化 学习 机器人 控制
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-4696254.html