音频媒体文件
标签搜索结果 for "计算效率"
Stanford CS336 Language Modeling from Scratch | Spring 2025 | Scaling laws 2
2025-06-04 13:29
LLM
缩放法则
µP (Maximal Update Parametrization)
超参数优化
模型训练优化
WSD学习率调度器
Chinchilla法则
计算效率
模型初始化
IsoFLOP分析
已摘要
阅读时间:12 分钟(4191 个字)
2 summary versions
BiliBili | IBM RethinkFun | 三分钟学会大模型PEFT的LORA算法 lora_rank lora_alpha
2025-06-01 22:18
LoRA算法
参数高效微调
大模型
人工智能
深度学习
低秩适应
模型微调
权重矩阵
lora_rank
lora_alpha
计算效率
已摘要
阅读时间:4 分钟(1298 个字)
1 summary version
Stanford CS25: V2 I Introduction to Transformers w/ Andrej Karpathy
2025-05-16 20:54
Transformers
深度学习
自然语言处理
注意力机制
模型架构
人工智能
计算机视觉
GPT模型
上下文学习
AI发展史
计算效率
未来AI
已摘要
阅读时间:14 分钟(4802 个字)
3 summary versions
Stanford CS336 Language Modeling from Scratch | Spring 2025 | 04 Mixture of experts
2025-05-13 16:59
大语言模型
混合专家
MoE架构
Transformer模型
稀疏激活
专家并行
模型训练
模型优化
计算效率
DeepSeek V3
已摘要
阅读时间:15 分钟(4973 个字)
3 summary versions