在这里,您可以找到几个致力于“深度强化学习”方法的项目。 项目以矩阵形式部署:[env x model],其中env是要解决的环境,而model是解决该环境的模型/算法。 在某些情况下,可以通过几种算法来解决同一环境。 所有项目均以包含培训日志的Jupyter笔记本的形式呈现 ...
我为了你我设计这个挑战:在这60天里深入学习“深度强化学习”。 你肯定听说过 Deepmind with AlphaGo Zero和 OpenAI in Dota 2取得的惊人成绩! 你难道不想知道他们是如何工作的吗?现在正是你我最终学会“深度强化学习”,并应用到已有项目的时机。 终极目标是使用 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果