master
由 GitHub 更新于 1 天之前
gma/xpu_compile_analysis
由 Ma, Guokai 更新于 1 周之前
jomayeri/aio-file-offset
由 Ubuntu 更新于 3 天之前
jomayeri/aio-locked-tensor
由 GitHub 更新于 1 周之前
jomayeri/aio-mem-fix
由 GitHub 更新于 4 天之前
jomayeri/deepnvme-perf-debug
由 jomayeri 更新于 3 周之前
jomayeri/lr-step-init
由 Ubuntu 更新于 1 周之前
jomayeri/lr-step-move
由 GitHub 更新于 3 周之前
jomayeri/swap-with-locked
由 Ubuntu 更新于 6 天之前
loadams/add-contributing-release-md-files
由 GitHub 更新于 2 周之前
loadams/fix-mpi4py
由 Logan Adams 更新于 3 周之前
loadams/fix-no-torch-failure-mlu
由 Logan Adams 更新于 3 周之前
loadams/fix-triggers-no-torch-workflow
由 Logan Adams 更新于 3 周之前
loadams/transformers-fixes
由 GitHub 更新于 3 周之前
loadams/update-nv-lightning-test-cu-ver
由 Logan Adams 更新于 2 周之前
olruwase/dnvme_docs
由 GitHub 更新于 3 周之前
olruwase/set_zero_opt_grad
由 GitHub 更新于 1 周之前
olruwase/zero_multi_models
由 Olatunji Ruwase 更新于 2 周之前
tohtana/allocate_test_port
由 Masahiro Tanaka 更新于 1 周之前
tohtana/autocast_only_floating_values
由 Masahiro Tanaka 更新于 1 周之前
tohtana/clean_all_param_coordinators
由 Masahiro Tanaka 更新于 2 周之前
tohtana/clean_up_prefetch_param
由 GitHub 更新于 1 周之前
tohtana/consistent_zero_grad
由 GitHub 更新于 3 周之前
tohtana/debug_semaphore_leak
由 GitHub 更新于 6 天之前
tohtana/file_store_for_tests
由 Masahiro Tanaka 更新于 4 天之前
tohtana/get_offload_state_api
由 GitHub 更新于 1 周之前
tohtana/ignore_reuse_dist_env
由 Masahiro Tanaka 更新于 1 周之前
tohtana/lock_hf_cache_update
由 GitHub 更新于 6 天之前
tohtana/log_run_tests
由 Masahiro Tanaka 更新于 5 天之前
tohtana/offload_zero_buffers
由 GitHub 更新于 3 周之前
tohtana/test_with_pt25
由 Masahiro Tanaka 更新于 5 天之前
AutoPR/0.12.2
由 GitHub 更新于 11 月之前
AutoPR/0.14.0
由 GitHub 更新于 7 月之前
CUDA-Graph-support
由 Reza Yazdani 更新于 2 年之前
HeyangQin/deepspeed-ulysses-chinese-blog
由 GitHub 更新于 1 年之前
HeyangQin/enable_hpz_nograd
由 HeyangQin 更新于 1 年之前
HeyangQin/fix_hpz_nograd
由 HeyangQin 更新于 1 年之前
HeyangQin/fix_issue_3062
由 GitHub 更新于 1 年之前
HeyangQin/fix_issue_3068
由 GitHub 更新于 1 年之前
HeyangQin/fix_issue_3156
由 HeyangQin 更新于 1 年之前
HeyangQin/fix_issue_5205
由 HeyangQin 更新于 6 月之前
HeyangQin/fix_pr_3462_standalone
由 GitHub 更新于 1 年之前
HeyangQin/hpz_convergence
由 GitHub 更新于 10 月之前
HeyangQin/inference_t5_phase1
由 HeyangQin 更新于 1 年之前
HeyangQin/mixed_precision_lora_sam
由 HeyangQin 更新于 1 年之前
HeyangQin/mixz_tutorial
由 GitHub 更新于 1 年之前
HeyangQin/skip_bias_quant
由 HeyangQin 更新于 1 年之前
HeyangQin/staging-zero-pp-v1
由 HeyangQin 更新于 1 年之前
HeyangQin/ucp_blog_chinese
由 Heyang Qin 更新于 3 月之前
HeyangQin/ulysses_fp8
由 GitHub 更新于 6 月之前
Megtron-Kernel-Integration
由 Reza Yazdani 更新于 4 年之前
SA_feature_tag
由 arashashari 更新于 4 年之前
SA_tutorial_update
由 arashashari 更新于 4 年之前
SA_update_tutorial_link
由 GitHub 更新于 4 年之前
add-bfp16-support
由 Reza Yazdani 更新于 2 年之前
add-comm-layout
由 Reza Yazdani 更新于 11 月之前
add-inference-comm
由 Reza Yazdani 更新于 2 年之前
add-llama2-support
由 GitHub 更新于 1 年之前
add-quantizer
由 Reza Yazdani 更新于 2 年之前
add-shared-lib
由 Reza Yazdani 更新于 2 年之前
adk9/phi3-inference
由 GitHub 更新于 3 月之前
adk9/update-minor-cuda
由 Abhishek Kulkarni 更新于 4 月之前
amawa/1-bit-alltoall
由 Ammar Ahmad Awan 更新于 3 年之前
amawa/1bit-adam-nccl
由 Ammar Ahmad Awan 更新于 3 年之前
amawa/add-moe-container
由 Ammar Ahmad Awan 更新于 1 年之前
amawa/aml-get-hosts
由 GitHub 更新于 1 年之前
amawa/auto-save-ckpt
由 Ammar Ahmad Awan 更新于 3 年之前
amawa/config-pass-down
由 Ammar Ahmad Awan 更新于 1 年之前
amawa/debug
由 Ammar Ahmad Awan 更新于 3 年之前
amawa/fix-amd-rocm
由 Ammar Ahmad Awan 更新于 1 年之前
amawa/fix-auto-tp-load-ckpt
由 Ammar Ahmad Awan 更新于 1 年之前
amawa/fix-tracer-zero3
由 Ammar Ahmad Awan 更新于 2 年之前
amawa/fix-z3-for-hf-accelerate
由 Ammar Ahmad Awan 更新于 1 年之前
amawa/fix-z3-warn-print-v2
由 Ammar Ahmad Awan 更新于 2 年之前
amawa/inference-fix
由 Ammar Ahmad Awan 更新于 2 年之前
amawa/remove-deepcopy
由 Jeff Rasley 更新于 1 年之前
amawa/split-a2a
由 Ammar Ahmad Awan 更新于 3 年之前
amawa/zero-inf-refactor
由 GitHub 更新于 3 年之前
amd-jiting
由 GitHub 更新于 1 年之前
aml-autotuner
由 Cheng Li 更新于 1 年之前
arashb-patch-1
由 GitHub 更新于 9 月之前
arashb/fix-phi-2
由 GitHub 更新于 9 月之前
arpan/auto-check
由 Arpan Jain 更新于 2 年之前
autocast-fix
由 Jeff Rasley 更新于 1 年之前
awan-10-patch-1
由 GitHub 更新于 1 年之前
awan-10-patch-2
由 GitHub 更新于 1 年之前
awan-10-patch-3
由 GitHub 更新于 1 年之前
azure
由 Ammar Ahmad Awan 更新于 2 年之前
big-science
由 Jeff Rasley 更新于 3 年之前
big-science-v2
由 Jeff Rasley 更新于 3 年之前
bing/debugging
由 Bing Xie 更新于 1 年之前
bing/ds-adam
由 Bing Xie 更新于 1 年之前
bing/formatting-correction
由 Bing Xie 更新于 1 年之前
bing/io-tutorial
由 GitHub 更新于 1 年之前
bing/modify-ds-optimizer
由 Bing Xie 更新于 1 年之前
bing/optimizer-naming
由 GitHub 更新于 1 年之前
bloom-debug
由 GitHub 更新于 2 年之前
chatgpt-chinese-blog
由 Ammar Ahmad Awan 更新于 1 年之前
check-linear-sizes
由 Reza Yazdani 更新于 1 年之前
cholmes/activation-utils
由 GitHub 更新于 2 年之前
cholmes/checkpoints-inference-v2-2
由 GitHub 更新于 11 月之前
cholmes/fix-asym-quant
由 Connor Holmes 更新于 1 年之前
cholmes/fix_reduction_utils_amd
由 GitHub 更新于 1 年之前
cholmes/isolate-src-code
由 GitHub 更新于 11 月之前
cholmes/kv-cache-flexibility
由 Connor Holmes 更新于 11 月之前
cholmes/mem-access-predicated-load
由 GitHub 更新于 2 年之前
cholmes/migrate-to-dequant-lib
由 GitHub 更新于 1 年之前
cholmes/pipelined-quant
由 GitHub 更新于 1 年之前
cholmes/reduce-quantized-gpus
由 GitHub 更新于 1 年之前
cholmes/sd-extension
由 Connor Holmes 更新于 1 年之前
cholmes/ts-builder
由 cmikeh2 更新于 2 年之前
cholmes/unique-cuda-graphs
由 cmikeh2 更新于 2 年之前
ckpt-fix-unfused
由 GitHub 更新于 3 年之前
clean-llama
由 Molly Smith 更新于 1 年之前
clean-llama-v2
由 Molly Smith 更新于 1 年之前
clean-opt
由 GitHub 更新于 1 年之前
clean-opt-base
由 GitHub 更新于 1 年之前
clean-opt-v2
由 Lev Kurilenko 更新于 1 年之前
clean-opt-v2-base
由 Ammar Ahmad Awan 更新于 1 年之前
codegen-inference
由 GitHub 更新于 1 年之前
comm-opt2
由 Reza Yazani 更新于 10 月之前
costineseanu/windows_inference_build
由 GitHub 更新于 4 月之前
cpu-adam/optional_CUDA-copy
由 GitHub 更新于 3 年之前
debug-base-attn
由 Ammar Ahmad Awan 更新于 1 年之前
debug-ds-inf
由 Ammar Ahmad Awan 更新于 1 年之前
debug-ds-inf-torch-matmul
由 Ammar Ahmad Awan 更新于 1 年之前
ds-chat-blog-8-31
由 GitHub 更新于 1 年之前
ds-chat-clean-opt
由 Ammar Ahmad Awan 更新于 1 年之前
ds-chat-news
由 Ammar Ahmad Awan 更新于 1 年之前
ds-chat-release
由 GitHub 更新于 1 年之前
ds-inference/add-falcon-support
由 Reza Yazdani 更新于 1 年之前
ds-inference/bloom-support-meta
由 Jeff Rasley 更新于 2 年之前
ds-inference/fix-generation
由 GitHub 更新于 1 年之前
ds-inference/fix-mp
由 GitHub 更新于 2 年之前
ds-inference/remove-randgen
由 Reza Yazdani 更新于 2 年之前
ds-inference/simplify
由 GitHub 更新于 2 年之前
ds-inference/support-large-token-length
由 Reza Yazdani 更新于 2 年之前
ds-seq-tutorial
由 Ammar Ahmad Awan 更新于 1 年之前
ds-vchat-blog-v1
由 GitHub 更新于 1 年之前
ds-vchat-blog-v2
由 GitHub 更新于 1 年之前
duli/capability
由 GitHub 更新于 6 月之前
duli/cuda_op_builder
由 Du Li 更新于 4 月之前
duli/op_builder
由 Du Li 更新于 4 月之前
duli/pre_post
由 Du Li 更新于 1 年之前
duli/zero_debugging
由 Du Li 更新于 3 月之前
elastic-ckpt-refresh
由 Jeff Rasley 更新于 2 年之前
elasticity-v2
由 Jeff Rasley 更新于 3 年之前
eltonz/copy_grad_stream
由 Tunji Ruwase 更新于 3 年之前
enable-neox
由 Jeff Rasley 更新于 2 年之前
encoded-ds-config
由 GitHub 更新于 1 年之前
fairseq-moe
由 Ammar Ahmad Awan 更新于 2 年之前
fairseq-moe-debug
由 Ammar Ahmad Awan 更新于 2 年之前
falcon-180b
由 Reza Yazdani 更新于 1 年之前
fastgen-blog
由 GitHub 更新于 11 月之前
fastgen-blog-2
由 GitHub 更新于 9 月之前
features/rebase-quant-fp6
由 GitHub 更新于 7 月之前
fix-MoQ
由 Reza Yazdani 更新于 2 年之前
fix-autotuning-docs
由 Cheng Li 更新于 2 年之前
fix-autotuning-exit
由 Cheng Li 更新于 1 年之前
fix-autotuning-reqs
由 GitHub 更新于 2 年之前
fix-flops-profiler
由 GitHub 更新于 2 年之前
fix-fp16-test
由 GitHub 更新于 2 年之前
fix-injection
由 GitHub 更新于 1 年之前
fix-max_train_batch_size
由 Cheng Li 更新于 2 年之前
fix-misaligned-grad
由 Samyam 更新于 3 年之前
fix-moe-top1gating
由 Reza Yazdani 更新于 2 年之前
fix-sp-dense
由 GitHub 更新于 1 年之前
fix-sparse-attn
由 GitHub 更新于 2 年之前
fix-tuner-prescale_gradients
由 GitHub 更新于 1 年之前
fix-tuner-scheduler-bug
由 GitHub 更新于 1 年之前
fix-twitter
由 GitHub 更新于 1 年之前
fix-typos
由 Cheng Li 更新于 2 年之前
fix_mpu_ckpt
由 Logan Adams 更新于 7 月之前
flash-attention
由 Reza Yazdani 更新于 2 年之前
flops-profiler-skip-unused-args
由 GitHub 更新于 1 年之前
fp6-blog
由 GitHub 更新于 7 月之前
fs-82
由 Jeff Rasley 更新于 2 年之前
fs-soft-kernel
由 Reza Yazdani 更新于 2 年之前
fs-z2-fix
由 GitHub 更新于 2 年之前
fs/soft-kernel
由 Reza Yazdani Aminabadi 更新于 1 年之前
gcooper/make_optimizer_optional
由 Shaden Smith 更新于 3 年之前
generic-ckpt-loading
由 Reza Yazdani 更新于 1 年之前
gh-pages
由 Shaden Smith 更新于 4 年之前
gh-readonly-queue/master/pr-3852-3491e32d72746ec3d990108a23e67b2666b3e0e0
由 GitHub 更新于 1 年之前
gh-readonly-queue/master/pr-3852-adb9bc14b780115fd54f3f1234abcb7ab52fa975
由 GitHub 更新于 1 年之前
gh-readonly-queue/master/pr-3854-85503dab878875175b6d5eb6a39125878c172273
由 GitHub 更新于 1 年之前
gh-readonly-queue/master/pr-3892-548451ba4e8ea71029d738c33f639e0439aad1dd
由 GitHub 更新于 1 年之前
gh-readonly-queue/master/pr-3892-9f8817b2425bb82d9b6355caa6d2d0ebd036885d
由 GitHub 更新于 1 年之前
gh-readonly-queue/master/pr-3893-cc71eec8c85c4437d8139e53372da7f22224fed5
由 GitHub 更新于 1 年之前
gh-readonly-queue/master/pr-3928-82115d9059ce8271229c8f63153a02f2d323cfc1
由 GitHub 更新于 1 年之前
gh-readonly-queue/master/pr-4163-5e16eb2c939707d0d0062a458d77998fccb3afad
由 GitHub 更新于 1 年之前
good-moe
由 GitHub 更新于 2 年之前
gpt2-debug
由 Molly Smith 更新于 1 年之前
guanhua/adam-timer
由 GuanhuaWang 更新于 1 年之前
guanhua/adam-timer2
由 GuanhuaWang 更新于 1 年之前
guanhua/check-bf16
由 GuanhuaWang 更新于 6 月之前
guanhua/h2d-offload
由 GitHub 更新于 6 月之前
guanhua/kernel-test
由 GuanhuaWang 更新于 2 年之前
guanhua/mics-fix
由 GitHub 更新于 10 月之前
guanhua/overflow-check
由 GitHub 更新于 6 月之前
guanhua/quant-dequant-test
由 GitHub 更新于 2 年之前
guanhua/quant-test
由 GitHub 更新于 2 年之前
guanhua/rocm-cpu-adam
由 GuanhuaWang 更新于 1 年之前
guanhua/v14.0-bf16-check
由 GuanhuaWang 更新于 6 月之前
hf-workaround
由 Jeff Rasley 更新于 2 年之前
hp-sam
由 Sam Ade Jacobs 更新于 2 年之前
hpzero-preview
由 GitHub 更新于 1 年之前
inference-api/tutorial
由 Reza Yazdani 更新于 2 年之前
inference-read-checkpoint
由 Reza Yazdani 更新于 2 年之前
inference-refactor-v1-mro-test
由 Michael Wyatt 更新于 1 年之前
inference/ElutherAI-GPTJ
由 Reza Yazdani 更新于 3 年之前
inference/TP-general-support
由 GitHub 更新于 2 年之前
inference/add-bf16-support
由 Connor Holmes 更新于 1 年之前
inference/engine-api
由 Reza Yazdani 更新于 2 年之前
inference/fix-masking
由 GitHub 更新于 3 年之前
inference/fix-mp-init
由 GitHub 更新于 3 年之前
inference/support-encoder-decoder
由 Reza Yazdani 更新于 2 年之前
injection-fixes
由 Jeff Rasley 更新于 1 年之前
jeff-test
由 GitHub 更新于 2 年之前
jeffra-patch-2
由 GitHub 更新于 2 年之前
jeffra/1node-launcher-fix
由 Jeff Rasley 更新于 2 年之前
jeffra/2904
由 Jeff Rasley 更新于 1 年之前
jeffra/auto-bucket
由 Ammar Ahmad Awan 更新于 2 年之前
jeffra/available_memory
由 Jeff Rasley 更新于 1 年之前
jeffra/bf16-updates
由 Jeff Rasley 更新于 2 年之前
jeffra/bf16-updates-v2
由 Jeff Rasley 更新于 2 年之前
jeffra/ci-updates
由 Jeff Rasley 更新于 2 年之前
jeffra/ckpt-barrier
由 GitHub 更新于 2 年之前
jeffra/docker-update
由 GitHub 更新于 3 年之前
jeffra/engine-xthru
由 Jeff Rasley 更新于 3 年之前
jeffra/engine-xthru-v2
由 GitHub 更新于 3 年之前
jeffra/engine-xthru-v2-no-padding
由 GitHub 更新于 2 年之前
jeffra/external-skip
由 Jeff Rasley 更新于 1 年之前
jeffra/fix-1416
由 GitHub 更新于 3 年之前
jeffra/fs-diverge
由 GitHub 更新于 3 年之前
jeffra/fs-gas-fix
由 Jeff Rasley 更新于 2 年之前
jeffra/fs-gas-fix-v2
由 Jeff Rasley 更新于 2 年之前
jeffra/fs-support
由 Jeff Rasley 更新于 2 年之前
jeffra/fs-z3
由 Jeff Rasley 更新于 2 年之前
jeffra/fs-z3-v0510
由 Jeff Rasley 更新于 2 年之前
jeffra/gptj-fixes
由 Jeff Rasley 更新于 2 年之前
jeffra/inf-engine-refactor
由 Jeff Rasley 更新于 11 月之前
jeffra/inf-tests
由 GitHub 更新于 2 年之前
jeffra/jit-fix
由 Jeff Rasley 更新于 3 年之前
jeffra/latest-hf
由 Logan Adams 更新于 10 月之前
jeffra/op-build-api
由 GitHub 更新于 1 年之前
jeffra/prepost_fwd_and_generate
由 Jeff Rasley 更新于 1 年之前
jeffra/saksham-zero1-fixes
由 Jeff Rasley 更新于 3 年之前
jeffra/savepid2
由 Jeff Rasley 更新于 2 年之前
jeffra/shm-report
由 Jeff Rasley 更新于 1 年之前
jeffra/staging-comms-logging-v1
由 Jeff Rasley 更新于 2 年之前
jeffra/turn-on-opt-test
由 GitHub 更新于 1 年之前
jeffra/update-z3-check
由 Jeff Rasley 更新于 2 年之前
jeffra/z1-refresh
由 Jeff Rasley 更新于 3 年之前
jeffra/z1-refresh-2
由 Jeff Rasley 更新于 3 年之前
jeffra/z1-refresh-3
由 Jeff Rasley 更新于 3 年之前
jeffra/z3-fix
由 GitHub 更新于 2 年之前
jeffra/z3-new-param
由 GitHub 更新于 2 年之前
jeffra/zero-1-fix
由 Jeff Rasley 更新于 3 年之前
jeffra/zero-1-fix-test
由 GitHub 更新于 3 年之前
jeffra/zero-ckpt-fixes
由 Jeff Rasley 更新于 3 年之前
jeffra/zero-moe-noCG
由 Jeff Rasley 更新于 1 年之前
jeffra/zero1-grad-norm
由 Jeff Rasley 更新于 3 年之前
jerasley/mac
由 GitHub 更新于 1 年之前
jomayeri/bf16-zero-check
由 GitHub 更新于 1 年之前
jomayeri/debug-2361
由 GitHub 更新于 2 年之前
jomayeri/destroy-zero
由 GitHub 更新于 1 年之前
jomayeri/fp8-init
由 Joe Mayer 更新于 7 月之前
jomayeri/h100-unittest
由 GitHub 更新于 1 年之前
jomayeri/he-mp-assert
由 GitHub 更新于 1 年之前
jomayeri/issue-3367
由 GitHub 更新于 1 年之前
jomayeri/issue-3560
由 Joe Mayer 更新于 1 年之前
jomayeri/issue-3598
由 GitHub 更新于 1 年之前
jomayeri/issue-3769
由 Michael Wyatt 更新于 1 年之前
jomayeri/issue-4083
由 Joe Mayer 更新于 1 年之前
jomayeri/issue-4095
由 GitHub 更新于 1 年之前
jomayeri/issue-4183
由 GitHub 更新于 1 年之前
jomayeri/issue-5087
由 Joe Mayer 更新于 8 月之前
jomayeri/model-param-list
由 GitHub 更新于 1 年之前
jomayeri/new-zero-accum
由 GitHub 更新于 1 年之前
jomayeri/zero-grad-accum
由 GitHub 更新于 1 年之前
kv-cache-reset
由 Jeff Rasley 更新于 1 年之前
landing-training
由 GitHub 更新于 2 年之前
landing-updates
由 Shaden Smith 更新于 4 年之前
lekurile/add_ds_chat_workflow
由 Lev Kurilenko 更新于 1 年之前
lekurile/add_hip_abstraction
由 Lev Kurilenko 更新于 8 月之前
lekurile/clean_up_params
由 GitHub 更新于 1 年之前
lekurile/container_param_cleanup
由 Lev Kurilenko 更新于 1 年之前
lekurile/ds_chat_attn_mlp_base
由 Lev Kurilenko 更新于 1 年之前
lekurile/ds_chat_fix_test
由 Lev Kurilenko 更新于 6 月之前
lekurile/ds_chat_gh_wf
由 Lev Kurilenko 更新于 8 月之前
lekurile/ds_chat_mlp_debug
由 Lev Kurilenko 更新于 1 年之前
lekurile/ds_chat_revert_54c06872
由 Lev Kurilenko 更新于 6 月之前
lekurile/ds_chat_test_54c06872
由 GitHub 更新于 6 月之前
lekurile/ds_chat_test_7b5b0660
由 GitHub 更新于 6 月之前
lekurile/ds_chat_test_exit_first
由 Lev Kurilenko 更新于 1 年之前
lekurile/ds_chat_test_f69f8840
由 GitHub 更新于 6 月之前
lekurile/fix_ds_chat_bloom
由 Lev Kurilenko 更新于 1 年之前
lekurile/fix_formatting
由 Lev Kurilenko 更新于 1 年之前
lekurile/fix_he_print
由 Lev Kurilenko 更新于 10 月之前
lekurile/fix_issue_2330
由 Lev Kurilenko 更新于 2 年之前
lekurile/fix_opt_meta_tensor
由 Lev Kurilenko 更新于 1 年之前
lekurile/fix_phi_2
由 Lev Kurilenko 更新于 9 月之前
lekurile/fix_sd
由 GitHub 更新于 1 年之前
lekurile/fix_sd_ci
由 Lev Kurilenko 更新于 9 月之前
lekurile/fix_unet_vae
由 GitHub 更新于 11 月之前
lekurile/general_local_cg
由 Lev Kurilenko 更新于 1 年之前
lekurile/infv2_lm_eval
由 Lev Kurilenko 更新于 8 月之前
lekurile/kernel_hip_amd
由 Lev Kurilenko 更新于 8 月之前
lekurile/load_ckpt_inf_eng
由 Lev Kurilenko 更新于 1 年之前
lekurile/mlp_functions
由 Lev Kurilenko 更新于 1 年之前
lekurile/offload_fix_test
由 Nadav Elyahu 更新于 5 月之前
lekurile/sd_min_ver
由 Lev Kurilenko 更新于 8 月之前
lekurile/test_rearrange_ops
由 GitHub 更新于 5 月之前
lekurile/update_ds_chat_ci
由 GitHub 更新于 11 月之前
lekurile/update_ds_chat_ci_2
由 GitHub 更新于 5 月之前
lekurile/update_ds_chat_ci_test
由 Lev Kurilenko 更新于 11 月之前
lekurile/update_dschat_wf
由 GitHub 更新于 5 月之前
lekurile/update_inf_ckpt_load
由 Lev Kurilenko 更新于 1 年之前
lf-test
由 GitHub 更新于 2 年之前
loadams/add-gaudi-badge-readme
由 Logan Adams 更新于 7 月之前
loadams/add-scheduled-open-issue-check-ds-chat
由 Logan Adams 更新于 1 年之前
loadams/add-torch-2-support
由 Logan Adams 更新于 1 年之前
loadams/amd-57
由 GitHub 更新于 5 月之前
loadams/amd-mi200-tests
由 GitHub 更新于 1 年之前
loadams/amd-pre-compile
由 GitHub 更新于 1 年之前
loadams/amd-updates
由 Logan Adams 更新于 1 年之前
loadams/auto-stage3-prefetch-bucket-size
由 Logan Adams 更新于 6 月之前
loadams/auto-task-open-failure
由 Logan Adams 更新于 1 年之前
loadams/build-for-cpu
由 Logan Adams 更新于 11 月之前
loadams/changes-to-op-builder
由 Logan Adams 更新于 1 年之前
loadams/cpu-inf
由 Logan Adams 更新于 1 年之前
loadams/cpu-inf-triggers
由 GitHub 更新于 9 月之前
loadams/cpu-inf-v0-docker
由 Logan Adams 更新于 8 月之前
loadams/cpu-inference-shorten
由 Logan Adams 更新于 1 年之前
loadams/cpu-torch
由 GitHub 更新于 11 月之前
loadams/cu118
由 Logan Adams 更新于 11 月之前
loadams/debug-torch
由 Logan Adams 更新于 9 月之前
loadams/disable-h100-ci
由 Logan Adams 更新于 1 年之前
loadams/disable-windows-ops-build-script
由 Logan Adams 更新于 5 月之前
loadams/dot-deepspeed_env-test
由 Logan Adams 更新于 1 年之前
loadams/dpkg-libaio
由 Logan Adams 更新于 1 年之前
loadams/empty-env-var-setup
由 GitHub 更新于 1 年之前
loadams/enable-amdmi200
由 GitHub 更新于 1 年之前
loadams/enable-workflow-dispatch-nv-torch-nightly-v100
由 Logan Adams 更新于 9 月之前
loadams/engine-pos-args
由 Logan Adams 更新于 6 月之前
loadams/fix-check-valid-version
由 GitHub 更新于 1 年之前
loadams/fix-cpu-inf-test-time
由 Logan Adams 更新于 1 年之前
loadams/fix-cuda-build-ops
由 Logan Adams 更新于 1 年之前
loadams/fix-fp16-bf16-logging-issue
由 Logan Adams 更新于 1 年之前
loadams/fix-hpu
由 Logan Adams 更新于 6 月之前
loadams/fix-lightning-pytorch2
由 Logan Adams 更新于 1 年之前
loadams/fix-nccl-comm-torch-check
由 Logan Adams 更新于 1 年之前
loadams/fix-nv-inference
由 GitHub 更新于 11 月之前
loadams/fix-nv-inference-hang
由 Logan Adams 更新于 8 月之前
loadams/fix-nv-torch-latest-v100
由 Logan Adams 更新于 3 月之前
loadams/fix-onebit-skip
由 Logan Adams 更新于 1 年之前
loadams/fix-torch-2
由 Logan Adams 更新于 1 年之前
loadams/fix-torch-compiler-hasattr
由 Logan Adams 更新于 8 月之前
loadams/get-amd-team-ci
由 Logan Adams 更新于 1 年之前
loadams/gh-cpu-inf
由 Logan Adams 更新于 1 年之前
loadams/gh-release-version-update
由 GitHub 更新于 1 年之前
loadams/hf-transformers-ci-fix
由 Logan Adams 更新于 1 年之前
loadams/hpu-uts
由 GitHub 更新于 7 月之前
loadams/ignore-unused-params-default
由 Logan Adams 更新于 9 月之前
loadams/libaio
由 GitHub 更新于 1 年之前
loadams/low-cpu-mem-ut
由 GitHub 更新于 1 年之前
loadams/lsb-release
由 Logan Adams 更新于 1 年之前
loadams/megatron
由 Logan Adams 更新于 1 年之前
loadams/megatron-lm-112
由 Logan Adams 更新于 1 年之前
loadams/megatron-new-pypi
由 GitHub 更新于 1 年之前
loadams/megatron-version
由 Logan Adams 更新于 1 年之前
loadams/more-torch-2-support
由 Logan Adams 更新于 1 年之前
loadams/nv-inf-jobs-test
由 Logan Adams 更新于 8 月之前
loadams/nv-inf-test
由 Logan Adams 更新于 9 月之前
loadams/nv-inference-revert
由 Logan Adams 更新于 11 月之前
loadams/nv-nightly
由 Logan Adams 更新于 1 年之前
loadams/nv-nightly-fix-transformers
由 Logan Adams 更新于 6 月之前
loadams/nv-sd-badge
由 Logan Adams 更新于 10 月之前
loadams/openmpi-eth0
由 Logan Adams 更新于 1 年之前
loadams/pin-torch-latest-ver
由 Logan Adams 更新于 6 月之前
loadams/py36
由 Logan Adams 更新于 6 月之前
loadams/pynvml
由 GitHub 更新于 5 月之前
loadams/recurse-flops-profiler
由 GitHub 更新于 11 月之前
loadams/reenable-cpu-inference
由 Logan Adams 更新于 11 月之前
loadams/remove-dead-code
由 GitHub 更新于 6 月之前
loadams/remove-modeling
由 Logan Adams 更新于 1 年之前
loadams/remove-python-36-check
由 Logan Adams 更新于 3 月之前
loadams/rename-fp-quantize-cu
由 Logan Adams 更新于 4 月之前
loadams/rename-nv-torch-latest-cpu-workflow
由 Logan Adams 更新于 7 月之前
loadams/revert-4660
由 Logan Adams 更新于 10 月之前
loadams/revert-5608
由 Logan Adams 更新于 3 月之前
loadams/revert-cpu-inf
由 Logan Adams 更新于 1 年之前
loadams/revert-loss
由 Logan Adams 更新于 10 月之前
loadams/revert-nv-inference-changes
由 GitHub 更新于 1 年之前
loadams/revert-pr-5608
由 Logan Adams 更新于 3 月之前
loadams/revert-userwarning
由 Logan Adams 更新于 8 月之前
loadams/rocm-fixes
由 GitHub 更新于 1 年之前
loadams/rocm57
由 Logan Adams 更新于 9 月之前
loadams/rocm6
由 GitHub 更新于 9 月之前
loadams/sd-paths
由 GitHub 更新于 9 月之前
loadams/setup-h100-triggers
由 GitHub 更新于 7 月之前
loadams/sigterm
由 GitHub 更新于 1 年之前
loadams/skip-nv-inference
由 Logan Adams 更新于 11 月之前
loadams/sparse-attn-fix
由 GitHub 更新于 1 年之前
loadams/sparse-attn-torch-2
由 Logan Adams 更新于 1 年之前
loadams/stablediffusion-test-triton2
由 GitHub 更新于 1 年之前
loadams/switch-modeling-compression
由 Logan Adams 更新于 1 年之前
loadams/switch-python-versions
由 GitHub 更新于 3 月之前
loadams/tar-vuln
由 Logan Adams 更新于 1 年之前
loadams/test-b421e8c8f31af254b63ad6e9839f617ab6d9c060
由 GitHub 更新于 3 月之前
loadams/test-compile
由 Logan Adams 更新于 6 月之前
loadams/test-cpu
由 Logan Adams 更新于 8 月之前
loadams/test-cpu-inf-fix
由 Logan Adams 更新于 8 月之前
loadams/test-f0e3f01d7c7a3d8748212e61eaf487fab41168a7
由 Logan Adams 更新于 3 月之前
loadams/test-fix-nv-inference
由 GitHub 更新于 8 月之前
loadams/test-glibc228
由 Logan Adams 更新于 3 月之前
loadams/test-merged-changes
由 Logan Adams 更新于 6 月之前
loadams/test-model-task
由 Logan Adams 更新于 1 年之前
loadams/test-nv-ds-chat-failure-mode
由 Logan Adams 更新于 1 年之前
loadams/test-nv-latest-cpu
由 Logan Adams 更新于 8 月之前
loadams/test-pytest-ordering
由 Logan Adams 更新于 8 月之前
loadams/test-runsc
由 Logan Adams 更新于 10 月之前
loadams/test-torch-2.3.0
由 Logan Adams 更新于 6 月之前
loadams/torch-cpu-mismatch-cudaopbuilder
由 GitHub 更新于 11 月之前
loadams/torch-nightly-debug
由 GitHub 更新于 1 年之前
loadams/transformers-torch
由 Logan Adams 更新于 1 年之前
loadams/transformers-torch-update
由 GitHub 更新于 9 月之前
loadams/transformers-workflow-dispatch
由 Logan Adams 更新于 10 月之前
loadams/try-bump-pydantic
由 GitHub 更新于 1 年之前
loadams/unpin-nv-torch-latest
由 GitHub 更新于 5 月之前
loadams/unpin-transformers
由 GitHub 更新于 1 年之前
loadams/update-2004-checkout-actions
由 Logan Adams 更新于 6 月之前
loadams/update-accelerate
由 Logan Adams 更新于 10 月之前
loadams/update-amd-required-paths
由 GitHub 更新于 6 月之前
loadams/update-conda-pydantic
由 Logan Adams 更新于 1 年之前
loadams/update-container-a6000
由 GitHub 更新于 6 月之前
loadams/update-docker
由 Logan Adams 更新于 10 月之前
loadams/update-dockerfile
由 Logan Adams 更新于 1 年之前
loadams/update-hpu-docker-container
由 Logan Adams 更新于 5 月之前
loadams/update-hpu-docker-image
由 Logan Adams 更新于 4 月之前
loadams/update-nodejs-reate-pr-action
由 Logan Adams 更新于 6 月之前
loadams/update-nv-accelerate
由 GitHub 更新于 8 月之前
loadams/update-nv-inference-torch-ver
由 GitHub 更新于 8 月之前
loadams/update-nv-torch-latest-cpu-torch-ver
由 Logan Adams 更新于 8 月之前
loadams/update-nv-torch-latest-cpu-version
由 Logan Adams 更新于 8 月之前
loadams/update-pydantic
由 Logan Adams 更新于 1 年之前
loadams/update-pytest
由 GitHub 更新于 6 月之前
loadams/update-pytest-error-codes
由 Logan Adams 更新于 8 月之前
loadams/update-real-latest
由 Logan Adams 更新于 8 月之前
loadams/update-sd-triton
由 Logan Adams 更新于 1 年之前
loadams/update-torch-113
由 GitHub 更新于 5 月之前
loadams/update-transformers
由 GitHub 更新于 10 月之前
loadams/update-transformers-cu116
由 Logan Adams 更新于 1 年之前
loadams/update-version-txt-post-release
由 Logan Adams 更新于 8 月之前
loadams/update-website-sidebar
由 Logan Adams 更新于 5 月之前
loadams/x86-accelerator
由 Michael Wyatt 更新于 8 月之前
loadams/xpu-readme
由 Logan Adams 更新于 6 月之前
loadams/xpu-test
由 Logan Adams 更新于 6 月之前
loadams/xpu-yml
由 Logan Adams 更新于 6 月之前
lokoppak/ln_schedule_update
由 GitHub 更新于 1 年之前
lokoppak/low_cpu_mem_usage_ut
由 Logan Adams 更新于 1 年之前
lokoppak/new_pt_binding
由 Lok Chand Koppaka 更新于 2 年之前
lokoppak/quantization_3d
由 GitHub 更新于 1 年之前
lokoppak/ref_ln
由 Lok Chand Koppaka 更新于 1 年之前
lsh
由 Elton Zheng 更新于 4 年之前
master-test
由 GitHub 更新于 2 年之前
megatron2.4-3d
由 Jeff Rasley 更新于 3 年之前
minjiaz/ds-seq-tutorial
由 Ammar Ahmad Awan 更新于 1 年之前
minjiaz/moe-comm
由 Minjia Zhang 更新于 1 年之前
minjiaz/moe-sharing
由 GitHub 更新于 2 年之前
moe-full-tp
由 GitHub 更新于 2 年之前
moe-inference-tutorial
由 GitHub 更新于 2 年之前
moe-inference-tutorial1
由 Jeff Rasley 更新于 2 年之前
moe-inference/add-tutorial
由 Jeff Rasley 更新于 2 年之前
moe-pipelining
由 GitHub 更新于 2 年之前
moe-timing
由 Siddharth Singh 更新于 2 年之前
mosm/autotp-he
由 Molly Smith 更新于 1 年之前
mosm/autotp_llama
由 Molly Smith 更新于 1 年之前
mosm/bloom_dev
由 Molly Smith 更新于 1 年之前
mosm/codegen
由 Molly Smith 更新于 1 年之前
mosm/debug-ds-attn
由 Ammar Ahmad Awan 更新于 1 年之前
mosm/debugger
由 GitHub 更新于 1 年之前
mosm/dschat-news
由 Molly Smith 更新于 1 年之前
mosm/inf-refactor
由 Molly Smith 更新于 1 年之前
mosm/llama2
由 GitHub 更新于 1 年之前
mosm/matmul_test
由 Molly Smith 更新于 1 年之前
mosm/module_parser
由 molly-smith 更新于 1 年之前
mosm/mp_tutorial
由 molly-smith 更新于 1 年之前
mosm/opt-kernel
由 Molly Smith 更新于 1 年之前
mosm/softmax
由 GitHub 更新于 1 年之前
mosm/softmax-longseq
由 Molly Smith 更新于 1 年之前
mosm/t5
由 Molly Smith 更新于 1 年之前
mosm/test
由 GitHub 更新于 2 年之前
mosm/tp_dev
由 molly-smith 更新于 1 年之前
mosm/wb-param
由 Molly Smith 更新于 1 年之前
mrwyattii/expand-fp16-tests
由 Michael Wyatt 更新于 1 年之前
mrwyattii/fix-for-mii-UT
由 Michael Wyatt 更新于 11 月之前
mrwyattii/fix-inference-skipped-tests
由 Michael Wyatt 更新于 1 年之前
mrwyattii/fix-launcher-user-args
由 Michael Wyatt 更新于 1 年之前
mrwyattii/fix-multi-node-checks
由 Michael Wyatt 更新于 1 年之前
mrwyattii/pin-datasets
由 Michael Wyatt 更新于 1 年之前
mrwyattii/remove-symlinks
由 Michael Wyatt 更新于 1 年之前
mrwyattii/rename-cpu-accelerator
由 Logan Adams 更新于 8 月之前
mrwyattii/safetensor
由 Michael Wyatt 更新于 11 月之前
mrwyattii/silence-backend-warning
由 Michael Wyatt 更新于 1 年之前
mrwyattii/update-GH-permission
由 GitHub 更新于 9 月之前
mrwyattii/update-MII-tests-infV2
由 GitHub 更新于 11 月之前
multi-z3-prs
由 Jeff Rasley 更新于 3 年之前
multi-z3-prs-r2
由 Jeff Rasley 更新于 3 年之前
mz/llama-support
由 Michael Wyatt 更新于 1 年之前
neox-q-int8
由 GitHub 更新于 1 年之前
niumanar/gan_optimizer
由 Niranjan Uma Naresh 更新于 4 年之前
offloadpp-news
由 GitHub 更新于 11 月之前
olruwase/accelerator_abstraction
由 GitHub 更新于 2 年之前
olruwase/adam_types
由 Olatunji Ruwase 更新于 3 年之前
olruwase/align_rrg_rs_param_order
由 GitHub 更新于 3 年之前
olruwase/all_gather_profiling
由 Tunji Ruwase 更新于 2 年之前
olruwase/amd_configurable_pp_rtol
由 Olatunji Ruwase 更新于 3 年之前
olruwase/assert_unused_parameters
由 Tunji Ruwase 更新于 3 年之前
olruwase/b16-debugging
由 Olatunji Ruwase 更新于 2 年之前
olruwase/bf16-updates-2
由 Olatunji Ruwase 更新于 2 年之前
olruwase/bf16_tied_weights_reduce
由 Olatunji Ruwase 更新于 2 年之前
olruwase/bf16_update_hp_params
由 Olatunji Ruwase 更新于 2 年之前
olruwase/bloom-support
由 Tunji Ruwase 更新于 2 年之前
olruwase/bloom_176b_checkpoint_bc
由 GitHub 更新于 2 年之前
olruwase/ci_pytorch_1x
由 Olatunji Ruwase 更新于 1 年之前
olruwase/disable_prefetch_profiler
由 GitHub 更新于 1 年之前
olruwase/disable_z3_prefetcher
由 Tunji Ruwase 更新于 1 年之前
olruwase/ds_2449
由 Tunji Ruwase 更新于 1 年之前
olruwase/ds_2921
由 Tunji Ruwase 更新于 1 年之前
olruwase/ds_3481
由 Tunji Ruwase 更新于 1 年之前
olruwase/ds_3680_2
由 Tunji Ruwase 更新于 1 年之前
olruwase/ds_3948
由 GitHub 更新于 1 年之前
olruwase/dynamic_graph_activation_checkpoint
由 Olatunji Ruwase 更新于 3 年之前
olruwase/elastic-ckpt-refresh
由 GitHub 更新于 2 年之前
olruwase/engine_destroy
由 Olatunji Ruwase 更新于 2 年之前
olruwase/fix_kernel_memory_bloat
由 Tunji Ruwase 更新于 3 年之前
olruwase/frozen_weights_unit_test
由 Tunji Ruwase 更新于 1 年之前
olruwase/fs-zero3_trace_fix
由 Olatunji Ruwase 更新于 2 年之前
olruwase/fs_z3_trace_error_disable
由 Olatunji Ruwase 更新于 2 年之前
olruwase/fs_z3_trace_log
由 Olatunji Ruwase 更新于 2 年之前
olruwase/fuse_torch_adam_w
由 GitHub 更新于 1 年之前
olruwase/gpt3-finetuning
由 Tunji Ruwase 更新于 3 年之前
olruwase/grad_accum_loss
由 Tunji Ruwase 更新于 3 年之前
olruwase/issue_3062
由 Olatunji Ruwase 更新于 1 年之前
olruwase/llama2_empty_group
由 GitHub 更新于 1 年之前
olruwase/local_storage_checkpoint
由 Olatunji Ruwase 更新于 2 年之前
olruwase/lr_warmup_decay
由 Olatunji Ruwase 更新于 3 年之前
olruwase/non_tensor_activation_checkpoint
由 Olatunji Ruwase 更新于 3 年之前
olruwase/nvme_finetune
由 GitHub 更新于 2 年之前
olruwase/nvme_offload_bug
由 GitHub 更新于 3 年之前
olruwase/nvme_perf_sweep
由 GitHub 更新于 3 年之前
olruwase/nvme_testsuite
由 Tunji Ruwase 更新于 3 年之前
olruwase/override_module_apply
由 Tunji Ruwase 更新于 1 年之前
olruwase/refactor_universal_checkpoint
由 GitHub 更新于 2 年之前
olruwase/restore_from_bit16_weights
由 GitHub 更新于 2 年之前
olruwase/round_robin_gradient_option
由 Olatunji Ruwase 更新于 3 年之前
olruwase/save_checkpoint_latest_false
由 Tunji Ruwase 更新于 3 年之前
olruwase/save_zero3_fp16_weights
由 Tunji Ruwase 更新于 3 年之前
olruwase/setup_env_libaio
由 GitHub 更新于 1 年之前
olruwase/trainable_parameters
由 Tunji Ruwase 更新于 3 年之前
olruwase/z3_perf_tune
由 Olatunji Ruwase 更新于 2 年之前
olruwase/z3_suppress_warning
由 Olatunji Ruwase 更新于 2 年之前
olruwase/zcode_model_expert
由 Tunji Ruwase 更新于 3 年之前
olruwase/zero1_non_tensor_checkpoint
由 Tunji Ruwase 更新于 3 年之前
olruwase/zero2_grad_accum_bug
由 Tunji Ruwase 更新于 3 年之前
olruwase/zero2_offload_keyerror
由 Tunji Ruwase 更新于 3 年之前
olruwase/zero2_offload_rrb_divergence
由 GitHub 更新于 3 年之前
olruwase/zero2_offload_slowdown
由 Tunji Ruwase 更新于 3 年之前
olruwase/zero2_trainable_parameters
由 GitHub 更新于 2 年之前
olruwase/zero2_trainable_parameters_v0.5.7
由 Tunji Ruwase 更新于 2 年之前
olruwase/zero2_unbalanced_grad_reduction
由 Tunji Ruwase 更新于 3 年之前
olruwase/zero3_amp_autocast
由 Olatunji Ruwase 更新于 3 年之前
olruwase/zero3_broken_tracing
由 GitHub 更新于 3 年之前
olruwase/zero3_dp_norm_allreduce
由 GitHub 更新于 3 年之前
olruwase/zero3_profile_fetch
由 Olatunji Ruwase 更新于 2 年之前
olruwase/zero3_unboundlocal_bug
由 Olatunji Ruwase 更新于 3 年之前
olruwase/zero_inference_tokgen
由 Olatunji Ruwase 更新于 2 年之前
olruwase/zero_inference_torch_version
由 Tunji Ruwase 更新于 1 年之前
olruwase/zero_offload_e2e
由 Tunji Ruwase 更新于 4 年之前
olruwase/zero_offload_fix_corner_case
由 Tunji Ruwase 更新于 4 年之前
olruwase/zero_offload_v3
由 Tunji Ruwase 更新于 4 年之前
olruwase/zero_optional_reduce_scatter
由 GitHub 更新于 3 年之前
olruwase/zero_stage1_checkpoint_layout
由 Tunji Ruwase 更新于 3 年之前
olruwase/zero_stage1_elastic_checkpoint
由 Olatunji Ruwase 更新于 3 年之前
olruwase/zinf_none_swapper
由 GitHub 更新于 2 年之前
paper
由 GitHub 更新于 1 年之前
patch-z1-cont-grad
由 GitHub 更新于 2 年之前
pr_moe_tutorial
由 GitHub 更新于 2 年之前
preserve-CVDs
由 Jeff Rasley 更新于 2 年之前
profiler-add-shape
由 Cheng Li 更新于 2 年之前
qanthony/bigbird
由 GitHub 更新于 2 年之前
qanthony/comms-bench
由 Quentin Anthony 更新于 2 年之前
qanthony/nccl-backend
由 Quentin Anthony 更新于 2 年之前
quantization-refresh
由 GitHub 更新于 1 年之前
quantize-inference
由 Reza Yazdani 更新于 1 年之前
refine-quantizer
由 Reza Yazdani 更新于 2 年之前
remotes/origin/dev/tput
由 Shijie Zhou 更新于 1 年之前
remove-tbx
由 Jeff Rasley 更新于 2 年之前
remove-unused-quantize-settings
由 GitHub 更新于 1 年之前
reyazda/adam-scalar-fix
由 GitHub 更新于 3 年之前
reyazda/cpu_adam_jit_v2
由 Jeff Rasley 更新于 4 年之前
reyazda/fix-inference-api
由 GitHub 更新于 3 年之前
reyazda/pytorch-workspace-allocate
由 GitHub 更新于 3 年之前
reyazda/remove_bertid
由 Reza Yazdani 更新于 4 年之前
reyazda/support_AVX2_by_default
由 Reza Yazdani 更新于 4 年之前
reyazda/test-hidden-dimension
由 Reza Yazdani 更新于 3 年之前
reyazda/test-sparse
由 Jeff Rasley 更新于 3 年之前
reyazda/test-sparse-v2
由 Jeff Rasley 更新于 3 年之前
reyazda/test-transformer
由 Reza Yazdani 更新于 3 年之前
reyazda/testing_embedding
由 Reza Yazdani 更新于 3 年之前
reyazda/triton-new-sparse
由 Reza Yazdani 更新于 3 年之前
reza/deepspeed_adam_merge_v3
由 Reza Yazdani 更新于 4 年之前
reza/fix-adam-copyfp16
由 Reza Yazdani 更新于 4 年之前
reza/fix_adam_corner_case
由 Reza Yazdani 更新于 4 年之前
reza/fix_adam_perf
由 Reza Yazdani 更新于 4 年之前
reza/megatron_kernel_integration
由 Reza Yazdani 更新于 4 年之前
saksham-zero1-fixes
由 GitHub 更新于 3 年之前
samyam-overlap-comm
由 GitHub 更新于 4 年之前
samyamr/elasticity
由 Samyam Rajbhandari 更新于 3 年之前
samyamr/fix-for-fragmented-linear-inputs
由 GitHub 更新于 3 年之前
samyamr/gpt3-finetuning
由 Samyam Rajbhandari 更新于 3 年之前
samyamr/gpt3-finetuning-mixed-precision
由 Samyam Rajbhandari 更新于 3 年之前
samyamr/stage3-alignment-fix
由 GitHub 更新于 3 年之前
samyamr/zero-2-debug
由 GitHub 更新于 3 年之前
security-patch
由 Jeff Rasley 更新于 3 年之前
shaden/textgen
由 Shaden Smith 更新于 2 年之前
smartreply_hotfix
由 Jeff Rasley 更新于 4 年之前
sp/comm-opt
由 Reza Yazdani 更新于 10 月之前
sparse-attn-cuda11
由 GitHub 更新于 3 年之前
sparse-attn/support-latest-triton
由 GitHub 更新于 3 年之前
staging-amd
由 Jeff Rasley 更新于 3 年之前
staging-amd-port
由 Jeff Rasley 更新于 2 年之前
staging-amd-v2
由 Jeff Rasley 更新于 3 年之前
staging-amd-v3
由 Jeff Rasley 更新于 3 年之前
staging-comms-next-v2
由 GitHub 更新于 2 年之前
staging-comms-v1
由 Quentin Anthony 更新于 2 年之前
staging-demo-feature-v0
由 GitHub 更新于 1 年之前
staging-ds-chat-blog-v1
由 Ammar Ahmad Awan 更新于 1 年之前
staging-ds-seq-v1
由 GitHub 更新于 1 年之前
staging-inference-v2-5
由 GitHub 更新于 11 月之前
staging-mii-update
由 Jeff Rasley 更新于 2 年之前
staging-moe-next-v1
由 Jeff Rasley 更新于 2 年之前
staging-oaas
由 Elton Zheng 更新于 2 年之前
staging-pld-v1
由 Tunji Ruwase 更新于 4 年之前
staging-pp
由 Du Li 更新于 2 年之前
staging-test
由 GitHub 更新于 2 年之前
staging-zero-dual-v2
由 GitHub 更新于 4 年之前
staging-zero-dual-v3
由 GitHub 更新于 4 年之前
staging-zero-dual-v5
由 GitHub 更新于 4 年之前
staging-zero-inference-v1
由 GitHub 更新于 1 年之前
stale-issues
由 GitHub 更新于 3 年之前
styoun/triton-flash2
由 GitHub 更新于 1 年之前
styoun/triton2.1
由 GitHub 更新于 1 年之前
styoun/triton2.1-autotune
由 GitHub 更新于 1 年之前
styoun/zero-inf-8bit-q
由 GitHub 更新于 1 年之前
subprocess-test
由 Jeff Rasley 更新于 2 年之前
test-ac
由 Jeff Rasley 更新于 4 年之前
test-cuda-11.7
由 Reza Yazdani 更新于 1 年之前
tmp
由 GitHub 更新于 3 年之前
tmp-old
由 GitHub 更新于 1 年之前
tohtana/add_slides_meetup_japan
由 GitHub 更新于 4 月之前
tohtana/bcast_warning_z3
由 Masahiro Tanaka 更新于 8 月之前
tohtana/cache_kv_requirements
由 Masahiro Tanaka 更新于 9 月之前
tohtana/compile-zero
由 GitHub 更新于 8 月之前
tohtana/compile_no_grad
由 Masahiro Tanaka 更新于 6 月之前
tohtana/debug_compile_backends
由 Masahiro Tanaka 更新于 7 月之前
tohtana/fix-save-checkpoint-step
由 Masahiro Tanaka 更新于 1 年之前
tohtana/fix_bf16_opt_update_hp
由 Masahiro Tanaka 更新于 8 月之前
tohtana/fix_chkpt_alignment
由 Masahiro Tanaka 更新于 8 月之前
tohtana/fix_sort_dp_univ_ckpt
由 GitHub 更新于 6 月之前
tohtana/fix_univ_chkpt_load
由 Masahiro Tanaka 更新于 7 月之前
tohtana/model_declaration_in_init_context
由 GitHub 更新于 1 年之前
tohtana/pipeline_with_compiled_module
由 Masahiro Tanaka 更新于 7 月之前
tohtana/remove_step_on_init
由 GitHub 更新于 8 月之前
tohtana/univ_ckpt_custom_shape
由 GitHub 更新于 6 月之前
tohtana/z3_multi_dtypes
由 GitHub 更新于 11 月之前
token-drop
由 Ammar Ahmad Awan 更新于 3 年之前
transformer-injection
由 GitHub 更新于 2 年之前
transformer-kernel/support-arbitrary-hidden
由 Reza Yazdani 更新于 3 年之前
transformer/fix-layer-norm
由 Reza Yazdani 更新于 3 年之前
transformer/injection
由 Reza Yazdani 更新于 3 年之前
transformer/large-seq-support
由 Reza Yazdani 更新于 3 年之前
transformer/triangular-mask
由 Reza Yazdani 更新于 3 年之前
triton-fix
由 Jeff Rasley 更新于 1 年之前
ucp_blog
由 Sam Ade Jacobs 更新于 3 月之前
umchand/test_compiler
由 Umesh Chand 更新于 4 月之前
umchand/triton/bias_act
由 Umesh Chand 更新于 8 月之前
unify-benchmark-knowledge
由 Michael Wyatt 更新于 2 年之前
update-flops-profiler-doc
由 GitHub 更新于 1 年之前
update-flops-profiler-pool-compute
由 Cheng Li 更新于 2 年之前
workaround-zero3
由 GitHub 更新于 2 年之前
z1-offload-multigpu
由 Jeff Rasley 更新于 2 年之前
z3-mem-leak
由 Jeff Rasley 更新于 1 年之前
zero-ckpt-cpu-issue-v2
由 Jeff Rasley 更新于 2 年之前
zhenyzhang-data
由 GitHub 更新于 1 年之前
zheweiyao/quantize_update
由 GitHub 更新于 3 年之前