作者 | SHA1 备注 | 提交日期 |
---|---|---|
gjoliver | 99a0088233 [RLlib] Unify the way we create local replay buffer for all agents (#19627) | 3 年之前 |
gjoliver | 89fbfc00f8 [RLlib] Some minor cleanups (buffer buffer_size -> capacity and others). (#19623) | 3 年之前 |
Sven Mika | 732197e23a [RLlib] Multi-GPU for tf-DQN/PG/A2C. (#13393) | 3 年之前 |
Sven Mika | 8000258333 [RLlib] R2D2 Implementation. (#13933) | 3 年之前 |
desktable | 5af745c90d [RLlib] Implement the SlateQ algorithm (#11450) | 4 年之前 |