音频媒体文件
标签搜索结果 for "模型架构"
2024-05-01 | Stanford CS25 V4 I Demystifying Mixtral of Experts
2025-05-20 13:31
人工智能
大语言模型
稀疏混合专家
Mixtral 8x7B
模型架构
推理效率
参数效率
模型可解释性
知识密集型任务
路由机制
开源模型
已摘要
阅读时间:12 分钟(3862 个字)
2 summary versions
Stanford CS25: V2 I Introduction to Transformers w/ Andrej Karpathy
2025-05-16 20:54
Transformers
深度学习
自然语言处理
注意力机制
模型架构
人工智能
计算机视觉
GPT模型
上下文学习
AI发展史
计算效率
未来AI
已摘要
阅读时间:14 分钟(4802 个字)
3 summary versions