提交历史

作者 SHA1 备注 提交日期
  gjoliver 99a0088233 [RLlib] Unify the way we create local replay buffer for all agents (#19627) 3 年之前
  gjoliver 89fbfc00f8 [RLlib] Some minor cleanups (buffer buffer_size -> capacity and others). (#19623) 3 年之前
  Sven Mika 732197e23a [RLlib] Multi-GPU for tf-DQN/PG/A2C. (#13393) 3 年之前
  Sven Mika 8000258333 [RLlib] R2D2 Implementation. (#13933) 3 年之前
  desktable 5af745c90d [RLlib] Implement the SlateQ algorithm (#11450) 4 年之前