capsule

ML-Agents(九)Wall Jump

萝らか妹 提交于 2020-08-08 19:17:26
目录 ML-Agents(九)Wall Jump 一、前言 二、课程训练(Curriculum Learning) 一个教学示例 具体实现 三、环境与训练参数 四、场景基本构成 五、代码分析 Agent初始化 环境观测值收集 Agent动作反馈 Agent重置 其他 六、训练 训练配置参数 开始训练 七、总结 ML-Agents(九)Wall Jump 一、前言 这次我们来看一下 Wall Jump 示例,这个例子又和我们之前学习的示例不同,它引用了 Curriculum Learning (课程学习)的学习方法,简单来讲就是使用授课学习的方式来训练神经网络,学习的样本从易到难,模拟人类学系的过程。先来看看本示例的最终效果: 由图中可以看到本示例的效果,小蓝需要越过蓝色的墙体到达绿色的目标地点,此外还可以留意到,蓝色的墙体高度是随机变化的:当蓝色的墙体较高时,小蓝推动大白块当梯子才能越过墙体;当蓝色墙体高度较低时,小蓝则可以直接跳跃过去。 因此,在本示例中,小蓝拥有两个训练好的训练模型—— SmallWallJump 和 BigWallJump ,分别对应矮墙(无墙)和高墙情况下的行动。 下面我们先来学习一下官方对于Curriculum Learning的相关文档。 二、课程训练(Curriculum Learning) 这一节内容主要是翻译官方文档 Training with

ML-Agents(九)Wall Jump

你离开我真会死。 提交于 2020-05-07 13:02:08
目录 ML-Agents(九)Wall Jump 一、前言 二、课程训练(Curriculum Learning) 一个教学示例 具体实现 三、环境与训练参数 四、场景基本构成 五、代码分析 Agent初始化 环境观测值收集 Agent动作反馈 Agent重置 其他 六、训练 训练配置参数 开始训练 七、总结 ML-Agents(九)Wall Jump 一、前言 这次我们来看一下 Wall Jump 示例,这个例子又和我们之前学习的示例不同,它引用了 Curriculum Learning (课程学习)的学习方法,简单来讲就是使用授课学习的方式来训练神经网络,学习的样本从易到难,模拟人类学系的过程。先来看看本示例的最终效果: 由图中可以看到本示例的效果,小蓝需要越过蓝色的墙体到达绿色的目标地点,此外还可以留意到,蓝色的墙体高度是随机变化的:当蓝色的墙体较高时,小蓝推动大白块当梯子才能越过墙体;当蓝色墙体高度较低时,小蓝则可以直接跳跃过去。 因此,在本示例中,小蓝拥有两个训练好的训练模型—— SmallWallJump 和 BigWallJump ,分别对应矮墙(无墙)和高墙情况下的行动。 下面我们先来学习一下官方对于Curriculum Learning的相关文档。 二、课程训练(Curriculum Learning) 这一节内容主要是翻译官方文档 Training with