unity ml-agents

ML-Agents(九)Wall Jump

萝らか妹 提交于 2020-08-08 19:17:26
目录 ML-Agents(九)Wall Jump 一、前言 二、课程训练(Curriculum Learning) 一个教学示例 具体实现 三、环境与训练参数 四、场景基本构成 五、代码分析 Agent初始化 环境观测值收集 Agent动作反馈 Agent重置 其他 六、训练 训练配置参数 开始训练 七、总结 ML-Agents(九)Wall Jump 一、前言 这次我们来看一下 Wall Jump 示例,这个例子又和我们之前学习的示例不同,它引用了 Curriculum Learning (课程学习)的学习方法,简单来讲就是使用授课学习的方式来训练神经网络,学习的样本从易到难,模拟人类学系的过程。先来看看本示例的最终效果: 由图中可以看到本示例的效果,小蓝需要越过蓝色的墙体到达绿色的目标地点,此外还可以留意到,蓝色的墙体高度是随机变化的:当蓝色的墙体较高时,小蓝推动大白块当梯子才能越过墙体;当蓝色墙体高度较低时,小蓝则可以直接跳跃过去。 因此,在本示例中,小蓝拥有两个训练好的训练模型—— SmallWallJump 和 BigWallJump ,分别对应矮墙(无墙)和高墙情况下的行动。 下面我们先来学习一下官方对于Curriculum Learning的相关文档。 二、课程训练(Curriculum Learning) 这一节内容主要是翻译官方文档 Training with

Unity 用ml-agents机器学习造个游戏AI吧(2) (深度强化学习入门DEMO)

爷,独闯天下 提交于 2020-07-26 19:17:33
目录 本次示例:训练一个追踪红球的白球AI 1. 新建Unity项目,导入package 2. 编写Agent脚本 void OnEpisodeBegin() void CollectObservations(VectorSensor sensor) void OnActionReceived(float[] vectorAction) void Heuristic(float[] action) 3. 搭建好游戏场景 4. 调整脚本参数 Behavior Parameters Roller Agent Decision Requester 5. 开始训练 6. 将训练过的模型整合到Unity中 附录 config文件配置 参考 前言:上一篇博文已经介绍了 Unity Ml-Agents的环境配置 了。 个人建议先敲深度强化学习的Demo再摸清概念比较容易上手,因此本文先提供一个深度强化学习的Demo示例简单阐述下。 更新于2020.3.6:由于现在Unity ml-agents项目比起2018年已经更新了许多,以前的Demo教程已经不适合了,因此决定翻新Unity ml-agents机器学习系列博客。 更新于2020.7.6:没想到仅仅过了几个月,ml-agents项目已经从最初的beta版到现在已经第3个正式发行版了。因此再次翻新博客。 本次示例:训练一个追踪红球的白球AI 1

Unity 用ml-agents机器学习造个游戏AI吧(2) (深度强化学习入门DEMO)

我怕爱的太早我们不能终老 提交于 2020-07-26 07:49:04
目录 本次示例:训练一个追踪红球的白球AI 1. 新建Unity项目,导入package 2. 编写Agent脚本 void OnEpisodeBegin() void CollectObservations(VectorSensor sensor) void OnActionReceived(float[] vectorAction) void Heuristic(float[] action) 3. 搭建好游戏场景 4. 调整脚本参数 Behavior Parameters Roller Agent Decision Requester 5. 开始训练 6. 将训练过的模型整合到Unity中 附录 config文件配置 参考 前言:上一篇博文已经介绍了 Unity Ml-Agents的环境配置 了。 个人建议先敲深度强化学习的Demo再摸清概念比较容易上手,因此本文先提供一个深度强化学习的Demo示例简单阐述下。 更新于2020.3.6:由于现在Unity ml-agents项目比起2018年已经更新了许多,以前的Demo教程已经不适合了,因此决定翻新Unity ml-agents机器学习系列博客。 更新于2020.7.6:没想到仅仅过了几个月,ml-agents项目已经从最初的beta版到现在已经第3个正式发行版了。因此再次翻新博客。 本次示例:训练一个追踪红球的白球AI 1

ML-Agents(九)Wall Jump

你离开我真会死。 提交于 2020-05-07 13:02:08
目录 ML-Agents(九)Wall Jump 一、前言 二、课程训练(Curriculum Learning) 一个教学示例 具体实现 三、环境与训练参数 四、场景基本构成 五、代码分析 Agent初始化 环境观测值收集 Agent动作反馈 Agent重置 其他 六、训练 训练配置参数 开始训练 七、总结 ML-Agents(九)Wall Jump 一、前言 这次我们来看一下 Wall Jump 示例,这个例子又和我们之前学习的示例不同,它引用了 Curriculum Learning (课程学习)的学习方法,简单来讲就是使用授课学习的方式来训练神经网络,学习的样本从易到难,模拟人类学系的过程。先来看看本示例的最终效果: 由图中可以看到本示例的效果,小蓝需要越过蓝色的墙体到达绿色的目标地点,此外还可以留意到,蓝色的墙体高度是随机变化的:当蓝色的墙体较高时,小蓝推动大白块当梯子才能越过墙体;当蓝色墙体高度较低时,小蓝则可以直接跳跃过去。 因此,在本示例中,小蓝拥有两个训练好的训练模型—— SmallWallJump 和 BigWallJump ,分别对应矮墙(无墙)和高墙情况下的行动。 下面我们先来学习一下官方对于Curriculum Learning的相关文档。 二、课程训练(Curriculum Learning) 这一节内容主要是翻译官方文档 Training with