提交历史

作者 SHA1 备注 提交日期
  Sven Mika 2dbd5fbeac [RLlib] Add throughput per-second metrics (env/agent steps trained and -sampled) to Algorithm. (#34526) 1 年之前
  Sven Mika b1cda46681 [RLlib] SlateQ (tf GPU + multi-GPU) + Bandit fixes (#23276) 2 年之前
  Sven Mika 6522935291 [RLlib] Slate-Q tf implementation and tests/benchmarks. (#22389) 2 年之前