作者 | SHA1 备注 | 提交日期 |
---|---|---|
Sven Mika | 2dbd5fbeac [RLlib] Add throughput per-second metrics (env/agent steps trained and -sampled) to Algorithm. (#34526) | 1 年之前 |
Sven Mika | b1cda46681 [RLlib] SlateQ (tf GPU + multi-GPU) + Bandit fixes (#23276) | 2 年之前 |
Sven Mika | 6522935291 [RLlib] Slate-Q tf implementation and tests/benchmarks. (#22389) | 2 年之前 |