NeurIPS 2018夺冠功臣 | 百度正式发布PaddlePaddle深度强化学习框架PARL
【推荐阅读】微服务还能火多久?>>> 强化学习作为AI技术发展的重要分支,为各家AI公司高度重视。去年,百度首次参与NeurIPS 2018的强化学习赛事,就击败了多达400支来自全球研究机构以及各大公司研究部门的参赛队伍,大比分以绝对优势拿下了冠军,并受邀在加拿大蒙特利尔举办的NeurIPS 2018 Competition Workshop上分享。近日,百度PaddlePaddle正式发布在赛事夺冠中起到关键作用的深度强化学习框架PARL,同时开源了基于该框架的NeurIPS2018强化学习赛事的完整训练代码。(冠军解决方案见https://github.com/PaddlePaddle/PARL) PARL 的名字来源于 PA ddlepaddle R einfocement L earning,是一款基于百度PaddlePaddle打造的深度强化学习框架。PARL凝聚了百度多年来在强化学习领域的技术深耕和产品应用经验。与现有强化学习工具和平台相比,PARL具有更高的可扩展性、可复现性和可复用性,强大的大规模并行化和稀疏特征的支持能力,以及工业级应用案例的验证。 自2012年以来,百度就将在multi-arm bandits问题上的研究成果成功落地到推荐系统中,广泛应用于搜索、对话、推荐等产品,通过点击反馈结合在线训练的方式,动态调整探索(exploration)和收益