音频媒体文件
标签搜索结果 for "FSDP"
Stanford CS224N: NLP w/ DL | Spring 2024 | Lecture 12 - Efficient Training, Shikhar Murty
2025-05-16 20:37
高效训练
深度学习训练
混合精度训练
BFloat16
分布式训练
FSDP
参数高效微调
LoRA
GPU显存优化
大规模模型训练
已摘要
阅读时间:9 分钟(3078 个字)
3 summary versions
Stanford CS336 Language Modeling from Scratch | Spring 2025 |07 Parallelism 1
2025-05-13 17:44
大型语言模型
分布式训练
并行计算
数据并行
模型并行
流水线并行
张量并行
FSDP
GPU
TPU
集体通信
网络通信
已摘要
阅读时间:11 分钟(3561 个字)
2 summary versions