音频媒体文件
标签搜索结果 for "模型训练"
2025-06-11 | Stanford CS336 | Language Modeling from Scratch | Spring 2025 | Lecture 13: Data 1
2025-06-11 11:49
语言模型
LLM
模型训练
数据处理
预训练
指令微调
合成数据
Common Crawl
版权法
合理使用
已摘要
阅读时间:7 分钟(2385 个字)
2 summary versions
B站 | 微软Reactor_SH | 玩转 GitHub Copilot|面向 MLOps⧸数据科学家的 GitHub Copilot
2025-06-05 16:14
GitHub Copilot
MLOps
数据科学
AI编程助手
机器学习
数据预处理
特征工程
模型训练
模型评估
Pandas
Scikit-learn
代码生成
已摘要
阅读时间:7 分钟(2186 个字)
1 summary version
Stanford CS336 Language Modeling from Scratch | Spring 2025 | Scaling laws
2025-05-17 21:56
LLM
Scaling Laws
模型训练
超参数优化
Chinchilla法则
IsoFLOP分析
μP
数据伸缩
模型伸缩
训练效率
深度学习
已摘要
阅读时间:13 分钟(4437 个字)
2 summary versions
Stanford CS336 Language Modeling from Scratch | Spring 2025 | 03 Architectures, Hyperparameters
2025-05-13 16:59
语言模型
Transformer架构
大型语言模型
模型训练
训练稳定性
架构演进
层归一化
RMSNorm
旋转位置编码
SwiGLU
注意力机制
超参数
已摘要
阅读时间:9 分钟(3084 个字)
2 summary versions
Stanford CS336 Language Modeling from Scratch | Spring 2025 | 04 Mixture of experts
2025-05-13 16:59
大语言模型
混合专家
MoE架构
Transformer模型
稀疏激活
专家并行
模型训练
模型优化
计算效率
DeepSeek V3
已摘要
阅读时间:15 分钟(4973 个字)
3 summary versions
Stanford CS336 Language Modeling from Scratch | Spring 2025 | 01 Overview and Tokenization
2025-05-13 16:29
语言模型
LLMs
从零构建
Transformer
Tokenization
BPE
并行计算
规模法则
模型训练
模型对齐
数据处理
GPU优化
已摘要
阅读时间:15 分钟(4925 个字)
2 summary versions