DeepMind控制套件是一组具有标准化结构和可解释奖励的连续控制任务,旨在作为强化学习代理的性能基准。这些任务是用Python编写的,由MuJoCo物理引擎提供支持,使它们易于使用和修改。我们包括了几种学习算法的基准。
全国统一服务电话(免长途费):400-003-8030 邮箱:sh@china-forklift.com
上海电话:021-54082801 54111400 69830012 传真:021-39251296
上海地址:上海市青浦区康园路399弄10幢47号 邮编:201713
广州电话:020-85201055 85201056
广州地址:广州市天河区龙口东路34号广州龙口科技大厦1407室 邮编:510630