所有分支
AutoPR/0.12.2 由 GitHub 更新于 11 月之前
AutoPR/0.14.0 由 GitHub 更新于 7 月之前
AutoPR/0.14.5 由 github-actions[bot] 更新于 2 月之前
CUDA-Graph-support 由 Reza Yazdani 更新于 2 年之前
HeyangQin/deepspeed-ulysses-chinese-blog 由 GitHub 更新于 1 年之前
HeyangQin/enable_hpz_nograd 由 HeyangQin 更新于 1 年之前
HeyangQin/fastgen_moe_h100 由 GitHub 更新于 2 月之前
HeyangQin/fix_hpz_nograd 由 HeyangQin 更新于 1 年之前
HeyangQin/fix_issue_3062 由 GitHub 更新于 1 年之前
HeyangQin/fix_issue_3068 由 GitHub 更新于 1 年之前
HeyangQin/fix_issue_3156 由 HeyangQin 更新于 1 年之前
HeyangQin/fix_issue_5205 由 HeyangQin 更新于 6 月之前
HeyangQin/fix_pr_3462_standalone 由 GitHub 更新于 1 年之前
HeyangQin/hpz_convergence 由 GitHub 更新于 10 月之前
HeyangQin/inference_t5_phase1 由 HeyangQin 更新于 1 年之前
HeyangQin/mixed_precision_lora_sam 由 HeyangQin 更新于 1 年之前
HeyangQin/mixz_tutorial 由 GitHub 更新于 1 年之前
HeyangQin/skip_bias_quant 由 HeyangQin 更新于 1 年之前
HeyangQin/staging-zero-pp-v1 由 HeyangQin 更新于 1 年之前
HeyangQin/ucp_blog_chinese 由 Heyang Qin 更新于 3 月之前
HeyangQin/ulysses_fp8 由 GitHub 更新于 6 月之前
Megtron-Kernel-Integration 由 Reza Yazdani 更新于 4 年之前
SA_feature_tag 由 arashashari 更新于 4 年之前
SA_tutorial_update 由 arashashari 更新于 4 年之前
SA_update_tutorial_link 由 GitHub 更新于 4 年之前
add-bfp16-support 由 Reza Yazdani 更新于 2 年之前
add-comm-layout 由 Reza Yazdani 更新于 11 月之前
add-inference-comm 由 Reza Yazdani 更新于 2 年之前
add-llama2-support 由 GitHub 更新于 1 年之前
add-quantizer 由 Reza Yazdani 更新于 2 年之前
add-shared-lib 由 Reza Yazdani 更新于 2 年之前
adk9/phi3-inference 由 GitHub 更新于 3 月之前
adk9/phi3-small 由 GitHub 更新于 3 月之前
adk9/update-minor-cuda 由 Abhishek Kulkarni 更新于 4 月之前
amawa/1-bit-alltoall 由 Ammar Ahmad Awan 更新于 3 年之前
amawa/1bit-adam-nccl 由 Ammar Ahmad Awan 更新于 3 年之前
amawa/add-moe-container 由 Ammar Ahmad Awan 更新于 1 年之前
amawa/aml-get-hosts 由 GitHub 更新于 1 年之前
amawa/auto-save-ckpt 由 Ammar Ahmad Awan 更新于 3 年之前
amawa/config-pass-down 由 Ammar Ahmad Awan 更新于 1 年之前
amawa/debug 由 Ammar Ahmad Awan 更新于 3 年之前
amawa/fix-amd-rocm 由 Ammar Ahmad Awan 更新于 1 年之前
amawa/fix-auto-tp-load-ckpt 由 Ammar Ahmad Awan 更新于 1 年之前
amawa/fix-tracer-zero3 由 Ammar Ahmad Awan 更新于 2 年之前
amawa/fix-z3-for-hf-accelerate 由 Ammar Ahmad Awan 更新于 1 年之前
amawa/fix-z3-warn-print-v2 由 Ammar Ahmad Awan 更新于 2 年之前
amawa/inference-fix 由 Ammar Ahmad Awan 更新于 2 年之前
amawa/remove-deepcopy 由 Jeff Rasley 更新于 1 年之前
amawa/split-a2a 由 Ammar Ahmad Awan 更新于 3 年之前
amawa/zero-inf-refactor 由 GitHub 更新于 3 年之前
amd-jiting 由 GitHub 更新于 1 年之前
aml-autotuner 由 Cheng Li 更新于 1 年之前
arashb-patch-1 由 GitHub 更新于 9 月之前
arashb/fix-phi-2 由 GitHub 更新于 9 月之前
arpan/auto-check 由 Arpan Jain 更新于 2 年之前
autocast-fix 由 Jeff Rasley 更新于 1 年之前
awan-10-patch-1 由 GitHub 更新于 1 年之前
awan-10-patch-2 由 GitHub 更新于 1 年之前
awan-10-patch-3 由 GitHub 更新于 1 年之前
azure 由 Ammar Ahmad Awan 更新于 2 年之前
big-science 由 Jeff Rasley 更新于 3 年之前
big-science-v2 由 Jeff Rasley 更新于 3 年之前
bing/debugging 由 Bing Xie 更新于 1 年之前
bing/ds-adam 由 Bing Xie 更新于 1 年之前
bing/formatting-correction 由 Bing Xie 更新于 1 年之前
bing/io-tutorial 由 GitHub 更新于 1 年之前
bing/modify-ds-optimizer 由 Bing Xie 更新于 1 年之前
bing/optimizer-naming 由 GitHub 更新于 1 年之前
bloom-debug 由 GitHub 更新于 2 年之前
chatgpt-chinese-blog 由 Ammar Ahmad Awan 更新于 1 年之前
check-linear-sizes 由 Reza Yazdani 更新于 1 年之前
cholmes/activation-utils 由 GitHub 更新于 2 年之前
cholmes/checkpoints-inference-v2-2 由 GitHub 更新于 11 月之前
cholmes/comm-group-cache 由 jomayeri 更新于 1 月之前
cholmes/fix-asym-quant 由 Connor Holmes 更新于 1 年之前
cholmes/fix_reduction_utils_amd 由 GitHub 更新于 1 年之前
cholmes/isolate-src-code 由 GitHub 更新于 11 月之前
cholmes/kv-cache-flexibility 由 Connor Holmes 更新于 11 月之前
cholmes/mem-access-predicated-load 由 GitHub 更新于 2 年之前
cholmes/migrate-to-dequant-lib 由 GitHub 更新于 1 年之前
cholmes/pipelined-quant 由 GitHub 更新于 1 年之前
cholmes/reduce-quantized-gpus 由 GitHub 更新于 1 年之前
cholmes/sd-extension 由 Connor Holmes 更新于 1 年之前
cholmes/ts-builder 由 cmikeh2 更新于 2 年之前
cholmes/unique-cuda-graphs 由 cmikeh2 更新于 2 年之前
ckpt-fix-unfused 由 GitHub 更新于 3 年之前
clean-llama 由 Molly Smith 更新于 1 年之前
clean-llama-v2 由 Molly Smith 更新于 1 年之前
clean-opt 由 GitHub 更新于 1 年之前
clean-opt-base 由 GitHub 更新于 1 年之前
clean-opt-v2 由 Lev Kurilenko 更新于 1 年之前
clean-opt-v2-base 由 Ammar Ahmad Awan 更新于 1 年之前
codegen-inference 由 GitHub 更新于 1 年之前
comm-opt2 由 Reza Yazani 更新于 10 月之前
costineseanu/windows_inference_build 由 GitHub 更新于 4 月之前
cpu-adam/optional_CUDA-copy 由 GitHub 更新于 3 年之前
debug-base-attn 由 Ammar Ahmad Awan 更新于 1 年之前
debug-ds-inf 由 Ammar Ahmad Awan 更新于 1 年之前
debug-ds-inf-torch-matmul 由 Ammar Ahmad Awan 更新于 1 年之前
ds-chat-blog-8-31 由 GitHub 更新于 1 年之前
ds-chat-clean-opt 由 Ammar Ahmad Awan 更新于 1 年之前
ds-chat-news 由 Ammar Ahmad Awan 更新于 1 年之前
ds-chat-release 由 GitHub 更新于 1 年之前
ds-inference/add-falcon-support 由 Reza Yazdani 更新于 1 年之前
ds-inference/bloom-support-meta 由 Jeff Rasley 更新于 2 年之前
ds-inference/fix-generation 由 GitHub 更新于 1 年之前
ds-inference/fix-mp 由 GitHub 更新于 2 年之前
ds-inference/remove-randgen 由 Reza Yazdani 更新于 2 年之前
ds-inference/simplify 由 GitHub 更新于 2 年之前
ds-inference/support-large-token-length 由 Reza Yazdani 更新于 2 年之前
ds-seq-tutorial 由 Ammar Ahmad Awan 更新于 1 年之前
ds-vchat-blog-v1 由 GitHub 更新于 1 年之前
ds-vchat-blog-v2 由 GitHub 更新于 1 年之前
duli/capability 由 GitHub 更新于 6 月之前
duli/cuda_op_builder 由 Du Li 更新于 4 月之前
duli/op_builder 由 Du Li 更新于 4 月之前
duli/pre_post 由 Du Li 更新于 1 年之前
duli/zero_debugging 由 Du Li 更新于 3 月之前
elastic-ckpt-refresh 由 Jeff Rasley 更新于 2 年之前
elasticity-v2 由 Jeff Rasley 更新于 3 年之前
eltonz/copy_grad_stream 由 Tunji Ruwase 更新于 3 年之前
enable-neox 由 Jeff Rasley 更新于 2 年之前
encoded-ds-config 由 GitHub 更新于 1 年之前
fairseq-moe 由 Ammar Ahmad Awan 更新于 2 年之前
fairseq-moe-debug 由 Ammar Ahmad Awan 更新于 2 年之前
falcon-180b 由 Reza Yazdani 更新于 1 年之前
fastgen-blog 由 GitHub 更新于 11 月之前
fastgen-blog-2 由 GitHub 更新于 9 月之前
features/rebase-quant-fp6 由 GitHub 更新于 7 月之前
fix-MoQ 由 Reza Yazdani 更新于 2 年之前
fix-autotuning-docs 由 Cheng Li 更新于 2 年之前
fix-autotuning-exit 由 Cheng Li 更新于 1 年之前
fix-autotuning-reqs 由 GitHub 更新于 2 年之前
fix-flops-profiler 由 GitHub 更新于 2 年之前
fix-fp16-test 由 GitHub 更新于 2 年之前
fix-injection 由 GitHub 更新于 1 年之前
fix-max_train_batch_size 由 Cheng Li 更新于 2 年之前
fix-misaligned-grad 由 Samyam 更新于 3 年之前
fix-moe-top1gating 由 Reza Yazdani 更新于 2 年之前
fix-sp-dense 由 GitHub 更新于 1 年之前
fix-sparse-attn 由 GitHub 更新于 2 年之前
fix-tuner-prescale_gradients 由 GitHub 更新于 1 年之前
fix-tuner-scheduler-bug 由 GitHub 更新于 1 年之前
fix-twitter 由 GitHub 更新于 1 年之前
fix-typos 由 Cheng Li 更新于 2 年之前
fix_mpu_ckpt 由 Logan Adams 更新于 7 月之前
flash-attention 由 Reza Yazdani 更新于 2 年之前
flops-profiler-skip-unused-args 由 GitHub 更新于 1 年之前
fp6-blog 由 GitHub 更新于 7 月之前
fs-82 由 Jeff Rasley 更新于 2 年之前
fs-soft-kernel 由 Reza Yazdani 更新于 2 年之前
fs-z2-fix 由 GitHub 更新于 2 年之前
fs/soft-kernel 由 Reza Yazdani Aminabadi 更新于 1 年之前
gcooper/make_optimizer_optional 由 Shaden Smith 更新于 3 年之前
generic-ckpt-loading 由 Reza Yazdani 更新于 1 年之前
gh-pages 由 Shaden Smith 更新于 4 年之前
gma/xpu_compile_analysis 由 Ma, Guokai 更新于 1 周之前
good-moe 由 GitHub 更新于 2 年之前
gpt2-debug 由 Molly Smith 更新于 1 年之前
guanhua/adam-timer 由 GuanhuaWang 更新于 1 年之前
guanhua/adam-timer2 由 GuanhuaWang 更新于 1 年之前
guanhua/check-bf16 由 GuanhuaWang 更新于 6 月之前
guanhua/fix-cutlass-ver 由 GuanhuaWang 更新于 2 月之前
guanhua/h2d-offload 由 GitHub 更新于 6 月之前
guanhua/kernel-test 由 GuanhuaWang 更新于 2 年之前
guanhua/mics-fix 由 GitHub 更新于 10 月之前
guanhua/overflow-check 由 GitHub 更新于 6 月之前
guanhua/quant-dequant-test 由 GitHub 更新于 2 年之前
guanhua/quant-test 由 GitHub 更新于 2 年之前
guanhua/rocm-cpu-adam 由 GuanhuaWang 更新于 1 年之前
guanhua/v14.0-bf16-check 由 GuanhuaWang 更新于 6 月之前
hf-workaround 由 Jeff Rasley 更新于 2 年之前
hp-sam 由 Sam Ade Jacobs 更新于 2 年之前
hpzero-preview 由 GitHub 更新于 1 年之前
inference-api/tutorial 由 Reza Yazdani 更新于 2 年之前
inference-read-checkpoint 由 Reza Yazdani 更新于 2 年之前
inference-refactor-v1-mro-test 由 Michael Wyatt 更新于 1 年之前
inference/ElutherAI-GPTJ 由 Reza Yazdani 更新于 3 年之前
inference/TP-general-support 由 GitHub 更新于 2 年之前
inference/add-bf16-support 由 Connor Holmes 更新于 1 年之前
inference/engine-api 由 Reza Yazdani 更新于 2 年之前
inference/fix-masking 由 GitHub 更新于 3 年之前
inference/fix-mp-init 由 GitHub 更新于 3 年之前
inference/support-encoder-decoder 由 Reza Yazdani 更新于 2 年之前
injection-fixes 由 Jeff Rasley 更新于 1 年之前
jeff-test 由 GitHub 更新于 2 年之前
jeffra-patch-2 由 GitHub 更新于 2 年之前
jeffra/1node-launcher-fix 由 Jeff Rasley 更新于 2 年之前
jeffra/2904 由 Jeff Rasley 更新于 1 年之前
jeffra/auto-bucket 由 Ammar Ahmad Awan 更新于 2 年之前
jeffra/available_memory 由 Jeff Rasley 更新于 1 年之前
jeffra/bf16-updates 由 Jeff Rasley 更新于 2 年之前
jeffra/bf16-updates-v2 由 Jeff Rasley 更新于 2 年之前
jeffra/ci-updates 由 Jeff Rasley 更新于 2 年之前
jeffra/ckpt-barrier 由 GitHub 更新于 2 年之前
jeffra/docker-update 由 GitHub 更新于 3 年之前
jeffra/engine-xthru 由 Jeff Rasley 更新于 3 年之前
jeffra/engine-xthru-v2 由 GitHub 更新于 3 年之前
jeffra/engine-xthru-v2-no-padding 由 GitHub 更新于 2 年之前
jeffra/external-skip 由 Jeff Rasley 更新于 1 年之前
jeffra/fix-1416 由 GitHub 更新于 3 年之前
jeffra/fs-diverge 由 GitHub 更新于 3 年之前
jeffra/fs-gas-fix 由 Jeff Rasley 更新于 2 年之前
jeffra/fs-gas-fix-v2 由 Jeff Rasley 更新于 2 年之前
jeffra/fs-support 由 Jeff Rasley 更新于 2 年之前
jeffra/fs-z3 由 Jeff Rasley 更新于 2 年之前
jeffra/fs-z3-v0510 由 Jeff Rasley 更新于 2 年之前
jeffra/gptj-fixes 由 Jeff Rasley 更新于 2 年之前
jeffra/inf-engine-refactor 由 Jeff Rasley 更新于 11 月之前
jeffra/inf-tests 由 GitHub 更新于 2 年之前
jeffra/jit-fix 由 Jeff Rasley 更新于 3 年之前
jeffra/latest-hf 由 Logan Adams 更新于 10 月之前
jeffra/op-build-api 由 GitHub 更新于 1 年之前
jeffra/prepost_fwd_and_generate 由 Jeff Rasley 更新于 1 年之前
jeffra/saksham-zero1-fixes 由 Jeff Rasley 更新于 3 年之前
jeffra/savepid2 由 Jeff Rasley 更新于 2 年之前
jeffra/shm-report 由 Jeff Rasley 更新于 1 年之前
jeffra/staging-comms-logging-v1 由 Jeff Rasley 更新于 2 年之前
jeffra/turn-on-opt-test 由 GitHub 更新于 1 年之前
jeffra/update-z3-check 由 Jeff Rasley 更新于 2 年之前
jeffra/z1-refresh 由 Jeff Rasley 更新于 3 年之前
jeffra/z1-refresh-2 由 Jeff Rasley 更新于 3 年之前
jeffra/z1-refresh-3 由 Jeff Rasley 更新于 3 年之前
jeffra/z3-fix 由 GitHub 更新于 2 年之前
jeffra/z3-new-param 由 GitHub 更新于 2 年之前
jeffra/zero-1-fix 由 Jeff Rasley 更新于 3 年之前
jeffra/zero-1-fix-test 由 GitHub 更新于 3 年之前
jeffra/zero-ckpt-fixes 由 Jeff Rasley 更新于 3 年之前
jeffra/zero-moe-noCG 由 Jeff Rasley 更新于 1 年之前
jeffra/zero1-grad-norm 由 Jeff Rasley 更新于 3 年之前
jerasley/mac 由 GitHub 更新于 1 年之前
jomayeri/aio-file-offset 由 Ubuntu 更新于 3 天之前
jomayeri/aio-locked-tensor 由 GitHub 更新于 1 周之前
jomayeri/aio-mem-fix 由 GitHub 更新于 4 天之前
jomayeri/aio-type-mismatch 由 GitHub 更新于 2 月之前
jomayeri/bf16-zero-check 由 GitHub 更新于 1 年之前
jomayeri/bug-5880 由 GitHub 更新于 2 月之前
jomayeri/debug-2361 由 GitHub 更新于 2 年之前
jomayeri/deepnvme-perf-debug 由 jomayeri 更新于 4 周之前
jomayeri/destroy-zero 由 GitHub 更新于 1 年之前
jomayeri/fp8-init 由 Joe Mayer 更新于 7 月之前
jomayeri/gds-swapper-fix 由 Ubuntu 更新于 2 月之前
jomayeri/h100-unittest 由 GitHub 更新于 1 年之前
jomayeri/he-mp-assert 由 GitHub 更新于 1 年之前
jomayeri/issue-3367 由 GitHub 更新于 1 年之前
jomayeri/issue-3560 由 Joe Mayer 更新于 1 年之前
jomayeri/issue-3598 由 GitHub 更新于 1 年之前
jomayeri/issue-3769 由 Michael Wyatt 更新于 1 年之前
jomayeri/issue-4083 由 Joe Mayer 更新于 1 年之前
jomayeri/issue-4095 由 GitHub 更新于 1 年之前
jomayeri/issue-4183 由 GitHub 更新于 1 年之前
jomayeri/issue-5087 由 Joe Mayer 更新于 8 月之前
jomayeri/lr-step-init 由 Ubuntu 更新于 1 周之前
jomayeri/lr-step-move 由 GitHub 更新于 3 周之前
jomayeri/model-param-list 由 GitHub 更新于 1 年之前
jomayeri/new-zero-accum 由 GitHub 更新于 1 年之前
jomayeri/swap-with-locked 由 Ubuntu 更新于 6 天之前
jomayeri/zero-grad-accum 由 GitHub 更新于 1 年之前
jomayeri/zero3-hooks 由 GitHub 更新于 2 月之前
kv-cache-reset 由 Jeff Rasley 更新于 1 年之前
landing-training 由 GitHub 更新于 2 年之前
landing-updates 由 Shaden Smith 更新于 4 年之前
lekurile/add_ds_chat_workflow 由 Lev Kurilenko 更新于 1 年之前
lekurile/add_hip_abstraction 由 Lev Kurilenko 更新于 8 月之前
lekurile/clean_up_params 由 GitHub 更新于 1 年之前
lekurile/container_param_cleanup 由 Lev Kurilenko 更新于 1 年之前
lekurile/ds_chat_attn_mlp_base 由 Lev Kurilenko 更新于 1 年之前
lekurile/ds_chat_fix_test 由 Lev Kurilenko 更新于 6 月之前
lekurile/ds_chat_gh_wf 由 Lev Kurilenko 更新于 8 月之前
lekurile/ds_chat_mlp_debug 由 Lev Kurilenko 更新于 1 年之前
lekurile/ds_chat_revert_54c06872 由 Lev Kurilenko 更新于 6 月之前
lekurile/ds_chat_test_54c06872 由 GitHub 更新于 6 月之前
lekurile/ds_chat_test_7b5b0660 由 GitHub 更新于 6 月之前
lekurile/ds_chat_test_exit_first 由 Lev Kurilenko 更新于 1 年之前
lekurile/ds_chat_test_f69f8840 由 GitHub 更新于 6 月之前
lekurile/fix_ds_chat_bloom 由 Lev Kurilenko 更新于 1 年之前
lekurile/fix_formatting 由 Lev Kurilenko 更新于 1 年之前
lekurile/fix_he_print 由 Lev Kurilenko 更新于 10 月之前
lekurile/fix_issue_2330 由 Lev Kurilenko 更新于 2 年之前
lekurile/fix_opt_meta_tensor 由 Lev Kurilenko 更新于 1 年之前
lekurile/fix_phi_2 由 Lev Kurilenko 更新于 9 月之前
lekurile/fix_sd 由 GitHub 更新于 1 年之前
lekurile/fix_sd_ci 由 Lev Kurilenko 更新于 9 月之前
lekurile/fix_unet_vae 由 GitHub 更新于 11 月之前
lekurile/general_local_cg 由 Lev Kurilenko 更新于 1 年之前
lekurile/infv2_lm_eval 由 Lev Kurilenko 更新于 8 月之前
lekurile/kernel_hip_amd 由 Lev Kurilenko 更新于 8 月之前
lekurile/load_ckpt_inf_eng 由 Lev Kurilenko 更新于 1 年之前
lekurile/mlp_functions 由 Lev Kurilenko 更新于 1 年之前
lekurile/offload_fix_test 由 Nadav Elyahu 更新于 5 月之前
lekurile/sd_min_ver 由 Lev Kurilenko 更新于 8 月之前
lekurile/test_rearrange_ops 由 GitHub 更新于 5 月之前
lekurile/update_ds_chat_ci 由 GitHub 更新于 11 月之前
lekurile/update_ds_chat_ci_2 由 GitHub 更新于 5 月之前
lekurile/update_ds_chat_ci_test 由 Lev Kurilenko 更新于 11 月之前
lekurile/update_dschat_wf 由 GitHub 更新于 5 月之前
lekurile/update_inf_ckpt_load 由 Lev Kurilenko 更新于 1 年之前
lf-test 由 GitHub 更新于 2 年之前
loadams/adam-params 由 GitHub 更新于 1 月之前
loadams/add-contributing-release-md-files 由 GitHub 更新于 2 周之前
loadams/add-gaudi-badge-readme 由 Logan Adams 更新于 7 月之前
loadams/add-scheduled-open-issue-check-ds-chat 由 Logan Adams 更新于 1 年之前
loadams/add-torch-2-support 由 Logan Adams 更新于 1 年之前
loadams/amd-57 由 GitHub 更新于 5 月之前
loadams/amd-mi200-tests 由 GitHub 更新于 1 年之前
loadams/amd-pre-compile 由 GitHub 更新于 1 年之前
loadams/amd-updates 由 Logan Adams 更新于 1 年之前
loadams/auto-stage3-prefetch-bucket-size 由 Logan Adams 更新于 6 月之前
loadams/auto-task-open-failure 由 Logan Adams 更新于 1 年之前
loadams/build-for-cpu 由 Logan Adams 更新于 11 月之前
loadams/changes-to-op-builder 由 Logan Adams 更新于 1 年之前
loadams/check-pydantic-v2-support 由 GitHub 更新于 2 月之前
loadams/clear-cache 由 GitHub 更新于 2 月之前
loadams/cpu-inf 由 Logan Adams 更新于 1 年之前
loadams/cpu-inf-triggers 由 GitHub 更新于 9 月之前
loadams/cpu-inf-v0-docker 由 Logan Adams 更新于 8 月之前
loadams/cpu-inference-shorten 由 Logan Adams 更新于 1 年之前
loadams/cpu-torch 由 GitHub 更新于 11 月之前
loadams/cu118 由 Logan Adams 更新于 11 月之前
loadams/debug-torch 由 Logan Adams 更新于 9 月之前
loadams/disable-h100-ci 由 Logan Adams 更新于 1 年之前
loadams/disable-windows-ops-build-script 由 Logan Adams 更新于 5 月之前
loadams/dot-deepspeed_env-test 由 Logan Adams 更新于 1 年之前
loadams/dpkg-libaio 由 Logan Adams 更新于 1 年之前
loadams/empty-env-var-setup 由 GitHub 更新于 1 年之前
loadams/enable-amdmi200 由 GitHub 更新于 1 年之前
loadams/enable-workflow-dispatch-nv-torch-nightly-v100 由 Logan Adams 更新于 9 月之前
loadams/engine-pos-args 由 Logan Adams 更新于 6 月之前
loadams/fix-check-valid-version 由 GitHub 更新于 1 年之前
loadams/fix-cpu-inf-test-time 由 Logan Adams 更新于 1 年之前
loadams/fix-cuda-build-ops 由 Logan Adams 更新于 1 年之前
loadams/fix-fp16-bf16-logging-issue 由 Logan Adams 更新于 1 年之前
loadams/fix-hpu 由 Logan Adams 更新于 6 月之前
loadams/fix-lightning-pytorch2 由 Logan Adams 更新于 1 年之前
loadams/fix-mpi4py 由 Logan Adams 更新于 3 周之前
loadams/fix-nccl-comm-torch-check 由 Logan Adams 更新于 1 年之前
loadams/fix-no-torch-failure-mlu 由 Logan Adams 更新于 3 周之前
loadams/fix-nv-inference 由 GitHub 更新于 11 月之前
loadams/fix-nv-inference-hang 由 Logan Adams 更新于 8 月之前
loadams/fix-nv-torch-latest-v100 由 Logan Adams 更新于 3 月之前
loadams/fix-onebit-skip 由 Logan Adams 更新于 1 年之前
loadams/fix-torch-2 由 Logan Adams 更新于 1 年之前
loadams/fix-torch-compiler-hasattr 由 Logan Adams 更新于 8 月之前
loadams/fix-triggers-no-torch-workflow 由 Logan Adams 更新于 3 周之前
loadams/flops-profiler-scaled-dor-attn-torch-2 由 GitHub 更新于 1 月之前
loadams/get-amd-team-ci 由 Logan Adams 更新于 1 年之前
loadams/gh-cpu-inf 由 Logan Adams 更新于 1 年之前
loadams/gh-release-version-update 由 GitHub 更新于 1 年之前
loadams/hf-transformers-ci-fix 由 Logan Adams 更新于 1 年之前
loadams/hpu-uts 由 GitHub 更新于 7 月之前
loadams/ignore-unused-params-default 由 Logan Adams 更新于 9 月之前
loadams/lamb-bf16 由 GitHub 更新于 1 月之前
loadams/libaio 由 GitHub 更新于 1 年之前
loadams/low-cpu-mem-ut 由 GitHub 更新于 1 年之前
loadams/lsb-release 由 Logan Adams 更新于 1 年之前
loadams/megatron 由 Logan Adams 更新于 1 年之前
loadams/megatron-lm-112 由 Logan Adams 更新于 1 年之前
loadams/megatron-new-pypi 由 GitHub 更新于 1 年之前
loadams/megatron-version 由 Logan Adams 更新于 1 年之前
loadams/more-torch-2-support 由 Logan Adams 更新于 1 年之前
loadams/nv-inf-jobs-test 由 Logan Adams 更新于 8 月之前
loadams/nv-inf-test 由 Logan Adams 更新于 9 月之前
loadams/nv-inference-revert 由 Logan Adams 更新于 11 月之前
loadams/nv-nightly 由 Logan Adams 更新于 1 年之前
loadams/nv-nightly-fix-transformers 由 Logan Adams 更新于 6 月之前
loadams/nv-sd-badge 由 Logan Adams 更新于 10 月之前
loadams/openmpi-eth0 由 Logan Adams 更新于 1 年之前
loadams/pin-torch-latest-ver 由 Logan Adams 更新于 6 月之前
loadams/py36 由 Logan Adams 更新于 6 月之前
loadams/pynvml 由 GitHub 更新于 5 月之前
loadams/recurse-flops-profiler 由 GitHub 更新于 11 月之前
loadams/reenable-cpu-inference 由 Logan Adams 更新于 11 月之前
loadams/remove-dead-code 由 GitHub 更新于 6 月之前
loadams/remove-modeling 由 Logan Adams 更新于 1 年之前
loadams/remove-python-36-check 由 Logan Adams 更新于 3 月之前
loadams/rename-fp-quantize-cu 由 Logan Adams 更新于 4 月之前
loadams/rename-nv-torch-latest-cpu-workflow 由 Logan Adams 更新于 7 月之前
loadams/revert-4660 由 Logan Adams 更新于 10 月之前
loadams/revert-5608 由 Logan Adams 更新于 3 月之前
loadams/revert-cpu-inf 由 Logan Adams 更新于 1 年之前
loadams/revert-loss 由 Logan Adams 更新于 10 月之前
loadams/revert-nv-inference-changes 由 GitHub 更新于 1 年之前
loadams/revert-pr-5608 由 Logan Adams 更新于 3 月之前
loadams/revert-userwarning 由 Logan Adams 更新于 8 月之前
loadams/rocm-fixes 由 GitHub 更新于 1 年之前
loadams/rocm57 由 Logan Adams 更新于 9 月之前
loadams/rocm6 由 GitHub 更新于 9 月之前
loadams/sd-paths 由 GitHub 更新于 9 月之前
loadams/setup-h100-triggers 由 GitHub 更新于 7 月之前
loadams/sigterm 由 GitHub 更新于 1 年之前
loadams/skip-nv-inference 由 Logan Adams 更新于 11 月之前
loadams/sparse-attn-fix 由 GitHub 更新于 1 年之前
loadams/sparse-attn-torch-2 由 Logan Adams 更新于 1 年之前
loadams/stablediffusion-test-triton2 由 GitHub 更新于 1 年之前
loadams/switch-modeling-compression 由 Logan Adams 更新于 1 年之前
loadams/switch-python-versions 由 GitHub 更新于 3 月之前
loadams/tar-vuln 由 Logan Adams 更新于 1 年之前
loadams/test-0.15.0 由 Logan Adams 更新于 1 月之前
loadams/test-amp-futurewarning 由 Logan Adams 更新于 2 月之前
loadams/test-ccl-fixes 由 Logan Adams 更新于 1 月之前
loadams/test-compile 由 Logan Adams 更新于 6 月之前
loadams/test-cpu 由 Logan Adams 更新于 8 月之前
loadams/test-cpu-inf-fix 由 Logan Adams 更新于 8 月之前
loadams/test-f0e3f01d7c7a3d8748212e61eaf487fab41168a7 由 Logan Adams 更新于 3 月之前
loadams/test-fix-nv-inference 由 GitHub 更新于 8 月之前
loadams/test-glibc228 由 Logan Adams 更新于 3 月之前
loadams/test-merged-changes 由 Logan Adams 更新于 6 月之前
loadams/test-model-task 由 Logan Adams 更新于 1 年之前
loadams/test-nv-ds-chat-failure-mode 由 Logan Adams 更新于 1 年之前
loadams/test-nv-latest-cpu 由 Logan Adams 更新于 8 月之前
loadams/test-nv-torch-latest-v100 由 Logan Adams 更新于 2 月之前
loadams/test-pytest-ordering 由 Logan Adams 更新于 8 月之前
loadams/test-runsc 由 Logan Adams 更新于 10 月之前
loadams/test-torch-2.3.0 由 Logan Adams 更新于 6 月之前
loadams/torch-cpu-mismatch-cudaopbuilder 由 GitHub 更新于 11 月之前
loadams/torch-nightly-debug 由 GitHub 更新于 1 年之前
loadams/transformers-fixes 由 GitHub 更新于 3 周之前
loadams/transformers-torch 由 Logan Adams 更新于 1 年之前
loadams/transformers-torch-update 由 GitHub 更新于 9 月之前
loadams/transformers-workflow-dispatch 由 Logan Adams 更新于 10 月之前
loadams/triton-22-update 由 GitHub 更新于 2 月之前
loadams/try-bump-pydantic 由 GitHub 更新于 1 年之前
loadams/unpin-hf-transformers-nv-workflows 由 Logan Adams 更新于 2 月之前
loadams/unpin-nv-torch-latest 由 GitHub 更新于 5 月之前
loadams/unpin-transformers 由 GitHub 更新于 1 年之前
loadams/update-2004-checkout-actions 由 Logan Adams 更新于 6 月之前
loadams/update-accelerate 由 Logan Adams 更新于 10 月之前
loadams/update-amd-required-paths 由 GitHub 更新于 6 月之前
loadams/update-checkout 由 GitHub 更新于 2 月之前
loadams/update-conda-pydantic 由 Logan Adams 更新于 1 年之前
loadams/update-container-a6000 由 GitHub 更新于 6 月之前
loadams/update-docker 由 Logan Adams 更新于 10 月之前
loadams/update-dockerfile 由 Logan Adams 更新于 1 年之前
loadams/update-hostname-I 由 Logan Adams 更新于 1 月之前
loadams/update-hpu-docker-container 由 Logan Adams 更新于 5 月之前
loadams/update-hpu-docker-image 由 Logan Adams 更新于 4 月之前
loadams/update-hpu-gaudi-flow-more 由 GitHub 更新于 2 月之前
loadams/update-nodejs-reate-pr-action 由 Logan Adams 更新于 6 月之前
loadams/update-nv-accelerate 由 GitHub 更新于 8 月之前
loadams/update-nv-inference-torch-ver 由 GitHub 更新于 8 月之前
loadams/update-nv-lightning-test-cu-ver 由 Logan Adams 更新于 2 周之前
loadams/update-nv-torch-latest-cpu-torch-ver 由 Logan Adams 更新于 8 月之前
loadams/update-nv-torch-latest-cpu-version 由 Logan Adams 更新于 8 月之前
loadams/update-pre-compile-ops-docker 由 Logan Adams 更新于 2 月之前
loadams/update-pydantic 由 Logan Adams 更新于 1 年之前
loadams/update-pytest 由 GitHub 更新于 6 月之前
loadams/update-pytest-error-codes 由 Logan Adams 更新于 8 月之前
loadams/update-real-latest 由 Logan Adams 更新于 8 月之前
loadams/update-sd-triton 由 Logan Adams 更新于 1 年之前
loadams/update-torch-113 由 GitHub 更新于 5 月之前
loadams/update-transformers 由 GitHub 更新于 10 月之前
loadams/update-transformers-cu116 由 Logan Adams 更新于 1 年之前
loadams/update-version-txt-post-release 由 Logan Adams 更新于 8 月之前
loadams/update-website-sidebar 由 Logan Adams 更新于 5 月之前
loadams/x86-accelerator 由 Michael Wyatt 更新于 8 月之前
loadams/xpu-readme 由 Logan Adams 更新于 6 月之前
loadams/xpu-test 由 Logan Adams 更新于 6 月之前
loadams/xpu-yml 由 Logan Adams 更新于 6 月之前
lokoppak/ln_schedule_update 由 GitHub 更新于 1 年之前
lokoppak/low_cpu_mem_usage_ut 由 Logan Adams 更新于 1 年之前
lokoppak/new_pt_binding 由 Lok Chand Koppaka 更新于 2 年之前
lokoppak/quantization_3d 由 GitHub 更新于 1 年之前
lokoppak/ref_ln 由 Lok Chand Koppaka 更新于 1 年之前
lsh 由 Elton Zheng 更新于 4 年之前
master 由 GitHub 更新于 1 天之前
master-test 由 GitHub 更新于 2 年之前
megatron2.4-3d 由 Jeff Rasley 更新于 3 年之前
minjiaz/ds-seq-tutorial 由 Ammar Ahmad Awan 更新于 1 年之前
minjiaz/moe-comm 由 Minjia Zhang 更新于 1 年之前
minjiaz/moe-sharing 由 GitHub 更新于 2 年之前
moe-full-tp 由 GitHub 更新于 2 年之前
moe-inference-tutorial 由 GitHub 更新于 2 年之前
moe-inference-tutorial1 由 Jeff Rasley 更新于 2 年之前
moe-inference/add-tutorial 由 Jeff Rasley 更新于 2 年之前
moe-pipelining 由 GitHub 更新于 2 年之前
moe-timing 由 Siddharth Singh 更新于 2 年之前
mosm/autotp-he 由 Molly Smith 更新于 1 年之前
mosm/autotp_llama 由 Molly Smith 更新于 1 年之前
mosm/bloom_dev 由 Molly Smith 更新于 1 年之前
mosm/codegen 由 Molly Smith 更新于 1 年之前
mosm/debug-ds-attn 由 Ammar Ahmad Awan 更新于 1 年之前
mosm/debugger 由 GitHub 更新于 1 年之前
mosm/dschat-news 由 Molly Smith 更新于 1 年之前
mosm/inf-refactor 由 Molly Smith 更新于 1 年之前
mosm/llama2 由 GitHub 更新于 1 年之前
mosm/matmul_test 由 Molly Smith 更新于 1 年之前
mosm/module_parser 由 molly-smith 更新于 1 年之前
mosm/mp_tutorial 由 molly-smith 更新于 1 年之前
mosm/opt-kernel 由 Molly Smith 更新于 1 年之前
mosm/softmax 由 GitHub 更新于 1 年之前
mosm/softmax-longseq 由 Molly Smith 更新于 1 年之前
mosm/t5 由 Molly Smith 更新于 1 年之前
mosm/test 由 GitHub 更新于 2 年之前
mosm/tp_dev 由 molly-smith 更新于 1 年之前
mosm/wb-param 由 Molly Smith 更新于 1 年之前
mrwyattii/expand-fp16-tests 由 Michael Wyatt 更新于 1 年之前
mrwyattii/fix-accelerate-tests 由 GitHub 更新于 2 月之前
mrwyattii/fix-for-mii-UT 由 Michael Wyatt 更新于 11 月之前
mrwyattii/fix-inference-skipped-tests 由 Michael Wyatt 更新于 1 年之前
mrwyattii/fix-launcher-user-args 由 Michael Wyatt 更新于 1 年之前
mrwyattii/fix-multi-node-checks 由 Michael Wyatt 更新于 1 年之前
mrwyattii/pin-datasets 由 Michael Wyatt 更新于 1 年之前
mrwyattii/pydantic-2-support 由 GitHub 更新于 2 月之前
mrwyattii/remove-symlinks 由 Michael Wyatt 更新于 1 年之前
mrwyattii/rename-cpu-accelerator 由 Logan Adams 更新于 8 月之前
mrwyattii/safetensor 由 Michael Wyatt 更新于 11 月之前
mrwyattii/silence-backend-warning 由 Michael Wyatt 更新于 1 年之前
mrwyattii/update-GH-permission 由 GitHub 更新于 9 月之前
mrwyattii/update-MII-tests-infV2 由 GitHub 更新于 11 月之前
multi-z3-prs 由 Jeff Rasley 更新于 3 年之前
multi-z3-prs-r2 由 Jeff Rasley 更新于 3 年之前
mz/llama-support 由 Michael Wyatt 更新于 1 年之前
neox-q-int8 由 GitHub 更新于 1 年之前
niumanar/gan_optimizer 由 Niranjan Uma Naresh 更新于 4 年之前
offloadpp-news 由 GitHub 更新于 11 月之前
olruwase/accelerator_abstraction 由 GitHub 更新于 2 年之前
olruwase/adam_types 由 Olatunji Ruwase 更新于 3 年之前
olruwase/align_rrg_rs_param_order 由 GitHub 更新于 3 年之前
olruwase/all_gather_profiling 由 Tunji Ruwase 更新于 2 年之前
olruwase/amd_configurable_pp_rtol 由 Olatunji Ruwase 更新于 3 年之前
olruwase/assert_unused_parameters 由 Tunji Ruwase 更新于 3 年之前
olruwase/b16-debugging 由 Olatunji Ruwase 更新于 2 年之前
olruwase/bf16-updates-2 由 Olatunji Ruwase 更新于 2 年之前
olruwase/bf16_tied_weights_reduce 由 Olatunji Ruwase 更新于 2 年之前
olruwase/bf16_update_hp_params 由 Olatunji Ruwase 更新于 2 年之前
olruwase/bloom-support 由 Tunji Ruwase 更新于 2 年之前
olruwase/bloom_176b_checkpoint_bc 由 GitHub 更新于 2 年之前
olruwase/build_compat_ops 由 Olatunji Ruwase 更新于 1 月之前
olruwase/ci_pytorch_1x 由 Olatunji Ruwase 更新于 1 年之前
olruwase/deepnvme_abstract_class 由 Ubuntu 更新于 2 月之前
olruwase/deepnvme_docs 由 GitHub 更新于 1 月之前
olruwase/disable_prefetch_profiler 由 GitHub 更新于 1 年之前
olruwase/disable_z3_prefetcher 由 Tunji Ruwase 更新于 1 年之前
olruwase/dnvme_docs 由 GitHub 更新于 3 周之前
olruwase/ds_2449 由 Tunji Ruwase 更新于 1 年之前
olruwase/ds_2921 由 Tunji Ruwase 更新于 1 年之前
olruwase/ds_3481 由 Tunji Ruwase 更新于 1 年之前
olruwase/ds_3680_2 由 Tunji Ruwase 更新于 1 年之前
olruwase/ds_3948 由 GitHub 更新于 1 年之前
olruwase/dynamic_graph_activation_checkpoint 由 Olatunji Ruwase 更新于 3 年之前
olruwase/elastic-ckpt-refresh 由 GitHub 更新于 2 年之前
olruwase/engine_destroy 由 Olatunji Ruwase 更新于 2 年之前
olruwase/fix_kernel_memory_bloat 由 Tunji Ruwase 更新于 3 年之前
olruwase/frozen_weights_unit_test 由 Tunji Ruwase 更新于 1 年之前
olruwase/fs-zero3_trace_fix 由 Olatunji Ruwase 更新于 2 年之前
olruwase/fs_z3_trace_error_disable 由 Olatunji Ruwase 更新于 2 年之前
olruwase/fs_z3_trace_log 由 Olatunji Ruwase 更新于 2 年之前
olruwase/fuse_torch_adam_w 由 GitHub 更新于 1 年之前
olruwase/gpt3-finetuning 由 Tunji Ruwase 更新于 3 年之前
olruwase/grad_accum_loss 由 Tunji Ruwase 更新于 3 年之前
olruwase/issue_3062 由 Olatunji Ruwase 更新于 1 年之前
olruwase/llama2_empty_group 由 GitHub 更新于 1 年之前
olruwase/local_storage_checkpoint 由 Olatunji Ruwase 更新于 2 年之前
olruwase/lr_warmup_decay 由 Olatunji Ruwase 更新于 3 年之前
olruwase/non_tensor_activation_checkpoint 由 Olatunji Ruwase 更新于 3 年之前
olruwase/nvme_finetune 由 GitHub 更新于 2 年之前
olruwase/nvme_offload_bug 由 GitHub 更新于 3 年之前
olruwase/nvme_perf_sweep 由 GitHub 更新于 3 年之前
olruwase/nvme_testsuite 由 Tunji Ruwase 更新于 3 年之前
olruwase/override_module_apply 由 Tunji Ruwase 更新于 1 年之前
olruwase/refactor_universal_checkpoint 由 GitHub 更新于 2 年之前
olruwase/restore_from_bit16_weights 由 GitHub 更新于 2 年之前
olruwase/round_robin_gradient_option 由 Olatunji Ruwase 更新于 3 年之前
olruwase/safe_pkg_check 由 Olatunji Ruwase 更新于 1 月之前
olruwase/safe_py_subprocess 由 GitHub 更新于 1 月之前
olruwase/save_checkpoint_latest_false 由 Tunji Ruwase 更新于 3 年之前
olruwase/save_zero3_fp16_weights 由 Tunji Ruwase 更新于 3 年之前
olruwase/set_zero_opt_grad 由 GitHub 更新于 1 周之前
olruwase/setup_env_libaio 由 GitHub 更新于 1 年之前
olruwase/trainable_parameters 由 Tunji Ruwase 更新于 3 年之前
olruwase/windows_blog 由 Logan Adams 更新于 2 月之前
olruwase/z3_perf_tune 由 Olatunji Ruwase 更新于 2 年之前
olruwase/z3_suppress_warning 由 Olatunji Ruwase 更新于 2 年之前
olruwase/zcode_model_expert 由 Tunji Ruwase 更新于 3 年之前
olruwase/zero1_non_tensor_checkpoint 由 Tunji Ruwase 更新于 3 年之前
olruwase/zero2_grad_accum_bug 由 Tunji Ruwase 更新于 3 年之前
olruwase/zero2_offload_keyerror 由 Tunji Ruwase 更新于 3 年之前
olruwase/zero2_offload_rrb_divergence 由 GitHub 更新于 3 年之前
olruwase/zero2_offload_slowdown 由 Tunji Ruwase 更新于 3 年之前
olruwase/zero2_trainable_parameters 由 GitHub 更新于 2 年之前
olruwase/zero2_trainable_parameters_v0.5.7 由 Tunji Ruwase 更新于 2 年之前
olruwase/zero2_unbalanced_grad_reduction 由 Tunji Ruwase 更新于 3 年之前
olruwase/zero3_amp_autocast 由 Olatunji Ruwase 更新于 3 年之前
olruwase/zero3_broken_tracing 由 GitHub 更新于 3 年之前
olruwase/zero3_dp_norm_allreduce 由 GitHub 更新于 3 年之前
olruwase/zero3_profile_fetch 由 Olatunji Ruwase 更新于 2 年之前
olruwase/zero3_unboundlocal_bug 由 Olatunji Ruwase 更新于 3 年之前
olruwase/zero_inference_tokgen 由 Olatunji Ruwase 更新于 2 年之前
olruwase/zero_inference_torch_version 由 Tunji Ruwase 更新于 1 年之前
olruwase/zero_multi_models 由 Olatunji Ruwase 更新于 2 周之前
olruwase/zero_offload_e2e 由 Tunji Ruwase 更新于 4 年之前
olruwase/zero_offload_fix_corner_case 由 Tunji Ruwase 更新于 4 年之前
olruwase/zero_offload_v3 由 Tunji Ruwase 更新于 4 年之前
olruwase/zero_optional_reduce_scatter 由 GitHub 更新于 3 年之前
olruwase/zero_stage1_checkpoint_layout 由 Tunji Ruwase 更新于 3 年之前
olruwase/zero_stage1_elastic_checkpoint 由 Olatunji Ruwase 更新于 3 年之前
olruwase/zinf_none_swapper 由 GitHub 更新于 2 年之前
paper 由 GitHub 更新于 1 年之前
patch-z1-cont-grad 由 GitHub 更新于 2 年之前
pr_moe_tutorial 由 GitHub 更新于 2 年之前
preserve-CVDs 由 Jeff Rasley 更新于 2 年之前
profiler-add-shape 由 Cheng Li 更新于 2 年之前
qanthony/bigbird 由 GitHub 更新于 2 年之前
qanthony/comms-bench 由 Quentin Anthony 更新于 2 年之前
qanthony/nccl-backend 由 Quentin Anthony 更新于 2 年之前
quantization-refresh 由 GitHub 更新于 1 年之前
quantize-inference 由 Reza Yazdani 更新于 1 年之前
refine-quantizer 由 Reza Yazdani 更新于 2 年之前
remotes/origin/dev/tput 由 Shijie Zhou 更新于 1 年之前
remove-tbx 由 Jeff Rasley 更新于 2 年之前
remove-unused-quantize-settings 由 GitHub 更新于 1 年之前
reyazda/adam-scalar-fix 由 GitHub 更新于 3 年之前
reyazda/cpu_adam_jit_v2 由 Jeff Rasley 更新于 4 年之前
reyazda/fix-inference-api 由 GitHub 更新于 3 年之前
reyazda/pytorch-workspace-allocate 由 GitHub 更新于 3 年之前
reyazda/remove_bertid 由 Reza Yazdani 更新于 4 年之前
reyazda/support_AVX2_by_default 由 Reza Yazdani 更新于 4 年之前
reyazda/test-hidden-dimension 由 Reza Yazdani 更新于 3 年之前
reyazda/test-sparse 由 Jeff Rasley 更新于 3 年之前
reyazda/test-sparse-v2 由 Jeff Rasley 更新于 3 年之前
reyazda/test-transformer 由 Reza Yazdani 更新于 3 年之前
reyazda/testing_embedding 由 Reza Yazdani 更新于 3 年之前
reyazda/triton-new-sparse 由 Reza Yazdani 更新于 3 年之前
reza/deepspeed_adam_merge_v3 由 Reza Yazdani 更新于 4 年之前
reza/fix-adam-copyfp16 由 Reza Yazdani 更新于 4 年之前
reza/fix_adam_corner_case 由 Reza Yazdani 更新于 4 年之前
reza/fix_adam_perf 由 Reza Yazdani 更新于 4 年之前
reza/megatron_kernel_integration 由 Reza Yazdani 更新于 4 年之前
rtd-staging 由 Ubuntu 更新于 2 月之前
saksham-zero1-fixes 由 GitHub 更新于 3 年之前
samyam-overlap-comm 由 GitHub 更新于 4 年之前
samyamr/elasticity 由 Samyam Rajbhandari 更新于 3 年之前
samyamr/fix-for-fragmented-linear-inputs 由 GitHub 更新于 3 年之前
samyamr/gpt3-finetuning 由 Samyam Rajbhandari 更新于 3 年之前
samyamr/gpt3-finetuning-mixed-precision 由 Samyam Rajbhandari 更新于 3 年之前
samyamr/stage3-alignment-fix 由 GitHub 更新于 3 年之前
samyamr/zero-2-debug 由 GitHub 更新于 3 年之前
security-patch 由 Jeff Rasley 更新于 3 年之前
shaden/textgen 由 Shaden Smith 更新于 2 年之前
smartreply_hotfix 由 Jeff Rasley 更新于 4 年之前
sp/comm-opt 由 Reza Yazdani 更新于 10 月之前
sparse-attn-cuda11 由 GitHub 更新于 3 年之前
sparse-attn/support-latest-triton 由 GitHub 更新于 3 年之前
staging-amd 由 Jeff Rasley 更新于 3 年之前
staging-amd-port 由 Jeff Rasley 更新于 2 年之前
staging-amd-v2 由 Jeff Rasley 更新于 3 年之前
staging-amd-v3 由 Jeff Rasley 更新于 3 年之前
staging-comms-next-v2 由 GitHub 更新于 2 年之前
staging-comms-v1 由 Quentin Anthony 更新于 2 年之前
staging-deepnvme-gds-v1 由 GitHub 更新于 2 月之前
staging-demo-feature-v0 由 GitHub 更新于 1 年之前
staging-ds-chat-blog-v1 由 Ammar Ahmad Awan 更新于 1 年之前
staging-ds-seq-v1 由 GitHub 更新于 1 年之前
staging-inference-v2-5 由 GitHub 更新于 11 月之前
staging-mii-update 由 Jeff Rasley 更新于 2 年之前
staging-moe-next-v1 由 Jeff Rasley 更新于 2 年之前
staging-oaas 由 Elton Zheng 更新于 2 年之前
staging-pld-v1 由 Tunji Ruwase 更新于 4 年之前
staging-pp 由 Du Li 更新于 2 年之前
staging-test 由 GitHub 更新于 2 年之前
staging-zero-dual-v2 由 GitHub 更新于 4 年之前
staging-zero-dual-v3 由 GitHub 更新于 4 年之前
staging-zero-dual-v5 由 GitHub 更新于 4 年之前
staging-zero-inference-v1 由 GitHub 更新于 1 年之前
stale-issues 由 GitHub 更新于 3 年之前
styoun/triton-flash2 由 GitHub 更新于 1 年之前
styoun/triton2.1 由 GitHub 更新于 1 年之前
styoun/triton2.1-autotune 由 GitHub 更新于 1 年之前
styoun/zero-inf-8bit-q 由 GitHub 更新于 1 年之前
subprocess-test 由 Jeff Rasley 更新于 2 年之前
test-ac 由 Jeff Rasley 更新于 4 年之前
test-cuda-11.7 由 Reza Yazdani 更新于 1 年之前
tmp 由 GitHub 更新于 3 年之前
tmp-old 由 GitHub 更新于 1 年之前
tohtana/add_slides_meetup_japan 由 GitHub 更新于 4 月之前
tohtana/allocate_test_port 由 Masahiro Tanaka 更新于 1 周之前
tohtana/autocast_only_floating_values 由 Masahiro Tanaka 更新于 1 周之前
tohtana/bcast_warning_z3 由 Masahiro Tanaka 更新于 8 月之前
tohtana/blog_win_jp 由 GitHub 更新于 2 月之前
tohtana/cache_kv_requirements 由 Masahiro Tanaka 更新于 9 月之前
tohtana/clean_all_param_coordinators 由 Masahiro Tanaka 更新于 2 周之前
tohtana/clean_up_prefetch_param 由 GitHub 更新于 1 周之前
tohtana/compile-zero 由 GitHub 更新于 8 月之前
tohtana/compile_no_grad 由 Masahiro Tanaka 更新于 6 月之前
tohtana/consistent_zero_grad 由 GitHub 更新于 3 周之前
tohtana/debug_compile_backends 由 Masahiro Tanaka 更新于 7 月之前
tohtana/debug_semaphore_leak 由 GitHub 更新于 1 周之前
tohtana/file_store_for_tests 由 Masahiro Tanaka 更新于 4 天之前
tohtana/fix-save-checkpoint-step 由 Masahiro Tanaka 更新于 1 年之前
tohtana/fix_bf16_opt_update_hp 由 Masahiro Tanaka 更新于 8 月之前
tohtana/fix_chkpt_alignment 由 Masahiro Tanaka 更新于 8 月之前
tohtana/fix_sort_dp_univ_ckpt 由 GitHub 更新于 6 月之前
tohtana/fix_univ_chkpt_load 由 Masahiro Tanaka 更新于 7 月之前
tohtana/fix_zero_init_patch 由 Masahiro Tanaka 更新于 2 月之前
tohtana/get_offload_state_api 由 GitHub 更新于 1 周之前
tohtana/ignore_reuse_dist_env 由 Masahiro Tanaka 更新于 1 周之前
tohtana/lock_hf_cache_update 由 GitHub 更新于 6 天之前
tohtana/log_run_tests 由 Masahiro Tanaka 更新于 5 天之前
tohtana/model_declaration_in_init_context 由 GitHub 更新于 1 年之前
tohtana/offload_zero_buffers 由 GitHub 更新于 3 周之前
tohtana/pipeline_with_compiled_module 由 Masahiro Tanaka 更新于 7 月之前
tohtana/remove_step_on_init 由 GitHub 更新于 8 月之前
tohtana/test_with_pt25 由 Masahiro Tanaka 更新于 5 天之前
tohtana/univ_ckpt_custom_shape 由 GitHub 更新于 6 月之前
tohtana/z3_multi_dtypes 由 GitHub 更新于 11 月之前
token-drop 由 Ammar Ahmad Awan 更新于 3 年之前
transformer-injection 由 GitHub 更新于 2 年之前
transformer-kernel/support-arbitrary-hidden 由 Reza Yazdani 更新于 3 年之前
transformer/fix-layer-norm 由 Reza Yazdani 更新于 3 年之前
transformer/injection 由 Reza Yazdani 更新于 3 年之前
transformer/large-seq-support 由 Reza Yazdani 更新于 3 年之前
transformer/triangular-mask 由 Reza Yazdani 更新于 3 年之前
triton-fix 由 Jeff Rasley 更新于 1 年之前
ucp_blog 由 Sam Ade Jacobs 更新于 3 月之前
umchand/test_compiler 由 Umesh Chand 更新于 4 月之前
umchand/triton/bias_act 由 Umesh Chand 更新于 8 月之前
unify-benchmark-knowledge 由 Michael Wyatt 更新于 2 年之前
update-flops-profiler-doc 由 GitHub 更新于 1 年之前
update-flops-profiler-pool-compute 由 Cheng Li 更新于 2 年之前
workaround-zero3 由 GitHub 更新于 2 年之前
z1-offload-multigpu 由 Jeff Rasley 更新于 2 年之前
z3-mem-leak 由 Jeff Rasley 更新于 1 年之前
zero-ckpt-cpu-issue-v2 由 Jeff Rasley 更新于 2 年之前
zhenyzhang-data 由 GitHub 更新于 1 年之前
zheweiyao/quantize_update 由 GitHub 更新于 3 年之前