作者 | SHA1 备注 | 提交日期 |
---|---|---|
Sven Mika | ed85f59194 [RLlib] Unify all RLlib Trainer.train() -> results[info][learner][policy ID][learner_stats] and add structure tests. (#18879) | 3 年之前 |
Sven Mika | 7eb1a29426 [RLlib] Fix ModelV2 custom metrics for torch. (#16734) | 3 年之前 |