Sebastian Raschka 534a704364 RoPE increase (#407) | 17 小时之前 | |
---|---|---|
.. | ||
01_main-chapter-code | 3 周之前 | |
02_alternative_weight_loading | 4 月之前 | |
03_bonus_pretraining_on_gutenberg | 2 月之前 | |
04_learning_rate_schedulers | 7 月之前 | |
05_bonus_hparam_tuning | 2 月之前 | |
06_user_interface | 1 月之前 | |
07_gpt_to_llama | 17 小时之前 | |
08_memory_efficient_weight_loading | 1 周之前 | |
README.md | 1 周之前 |
load_state_dict
method more efficiently