音频媒体文件
标签搜索结果 for "GPU"
Stanford CS336 Language Modeling from Scratch | Spring 2025 |07 Parallelism 1
2025-05-13 17:44
大型语言模型
分布式训练
并行计算
数据并行
模型并行
流水线并行
张量并行
FSDP
GPU
TPU
集体通信
网络通信
已摘要
阅读时间:11 分钟(3561 个字)
2 summary versions
Stanford CS336 Language Modeling from Scratch | Spring 2025 | 05 GPUs
2025-05-13 16:31
GPU
语言模型
高性能计算
CUDA
内存瓶颈
并行计算
性能优化
FlashAttention
分块
重计算
矩阵乘法
硬件加速
已摘要
阅读时间:11 分钟(3809 个字)
2 summary versions