PARL

飞桨工具组件简介——PARL

邮差的信 提交于 2020-03-03 16:48:27
PARL 是一个高性能、灵活的强化学习框架。 特点 可复现性保证 。我们提供了高质量的主流强化学习算法实现,严格地复现了论文对应的指标。 大规模并行支持 。框架最高可支持上万个CPU的同时并发计算,并且支持多GPU强化学习模型的训练。 可复用性强 。用户无需自己重新实现算法,通过复用框架提供的算法可以轻松地把经典强化学习算法应用到具体的场景中。 良好扩展性 。当用户想调研新的算法时,可以通过继承我们提供的基类可以快速实现自己的强化学习算法。 框架结构 PARL的目标是构建一个可以完整复杂任务的智能体。以下是用户在逐步构建一个智能体的过程中需要了解到的结构: Model Model 用来定义前向( Forward )网络,这通常是一个策略网络( Policy Network )或者一个值函数网络( Value Function ),输入是当前环境状态( State )。 Algorithm Algorithm 定义了具体的算法来更新前向网络( Model ),也就是通过定义损失函数来更新 Model 。一个 Algorithm 包含至少一个 Model 。 Agent Agent 负责算法与环境的交互,在交互过程中把生成的数据提供给 Algorithm 来更新模型( Model ),数据的预处理流程也一般定义在这里。 提示: 请访问 教程 and API 文档

2019,那些属于飞桨的重要时刻

有些话、适合烂在心里 提交于 2020-02-26 08:20:36
2019已经悄然落幕,在过去一年中,飞桨加速崛起,在产品性能上高效迭代,并屡次斩获多项大奖,其取得的成绩有目共睹,这也意味着飞桨正领衔中国深度学习框架迎来高光时刻。现在,让我们一起来回顾一下2019关于飞桨的那些重要记忆。 01 核心发布 一、 版本迭代 2019年,飞桨一共进行了4次大版本迭代,同时还推出了语义理解框架ERNIE,产品体验大幅提升,核心技术显著增强。 V1.3 3月,飞桨统一Executor和ParallelExecutor接口,正式发布AnalysisConfig 预测接口,支持计算图分析、算子融合等优化;模型库新增发布飞桨视频模型库,提供5个视频分类经典模型以及适合视频分类任务的通用骨架代码;新增支持NLP语义表示BERT模型,支持多机多卡训练,支持混合精度训练,训练速度对比主流实现提升50%+;发布大规模稀疏参数服务器Benchmark。 V1.4 4月,飞桨正式发布模型压缩工具包PaddleSlim和模型预测服务Paddle Serving,全面提升飞桨部署能力。正式发布视频分类工具包,覆盖主流视频分类模型;正式发布PaddleNLP,工业级中文NLP工具与预训练模型集。正式发布PaddleHub预训练模型管理工具,提供包括预训练模型管理、命令行一键式使用和迁移学习三大功能。发布业界领先的超大规模并行能力,包括大规模稀疏参数服务器解决方案、工业级数据处理