音频媒体文件
标签搜索结果 for "并行计算"
2025-06-06 | Stanford CS25: V5 | On the Biology of a Large Language Model, Josh Batson of Anthropic
2025-06-06 17:53
大型语言模型
机械可解释性
Anthropic
模型电路
稀疏自动编码器
抽象表征
并行计算
模型规划能力
AI安全
字典学习
模型行为分析
已摘要
阅读时间:10 分钟(3169 个字)
1 summary version
Stanford CS336 Language Modeling from Scratch | Spring 2025 |07 Parallelism 1
2025-05-13 17:44
大型语言模型
分布式训练
并行计算
数据并行
模型并行
流水线并行
张量并行
FSDP
GPU
TPU
集体通信
网络通信
已摘要
阅读时间:11 分钟(3561 个字)
2 summary versions
Stanford CS336 Language Modeling from Scratch | Spring 2025 | 05 GPUs
2025-05-13 16:31
GPU
语言模型
高性能计算
CUDA
内存瓶颈
并行计算
性能优化
FlashAttention
分块
重计算
矩阵乘法
硬件加速
已摘要
阅读时间:11 分钟(3809 个字)
2 summary versions
Stanford CS336 Language Modeling from Scratch | Spring 2025 | 01 Overview and Tokenization
2025-05-13 16:29
语言模型
LLMs
从零构建
Transformer
Tokenization
BPE
并行计算
规模法则
模型训练
模型对齐
数据处理
GPU优化
已摘要
阅读时间:15 分钟(4925 个字)
2 summary versions