音频媒体文件
标签搜索结果 for "Transformer架构"
Vision Transformer (ViT) Explained By Google Engineer | MultiModal LLM | Diffusion
2025-06-15 21:05
Vision Transformer (ViT)
计算机视觉
多模态LLM
自注意力机制
图像编码
深度学习
Transformer架构
CLIP模型
图像生成
Patch Embedding
全局上下文建模
人工智能
已摘要
阅读时间:13 分钟(4289 个字)
3 summary versions
2025-03-04 | Transformer Deep Dive with Google Engineer | Foundation of LLMs and Modern AI
2025-06-15 20:50
人工智能
深度学习
自然语言处理
Transformer架构
LLM
注意力机制
位置编码
多头注意力
KV缓存
归一化技术
模型推理优化
已摘要
阅读时间:17 分钟(5776 个字)
3 summary versions
2025-03-04 | CS224N | Lecture 18 - NLP, Linguistics, Philosophy
2025-06-05 22:45
自然语言处理 (NLP)
人工智能 (AI)
大型语言模型 (LLM)
Transformer架构
分布语义
规模化定律 (Scaling Laws)
AI伦理
模型可解释性
语言学与NLP
AI风险
符号主义 vs 连接主义
已摘要
阅读时间:11 分钟(3602 个字)
1 summary version
2024-04-11 | Stanford CS25: V4 Intuitions on Language Models
2025-05-18 15:58
人工智能
大型语言模型
Transformer架构
扩展定律
涌现能力
下一词预测
Decoder-Only模型
计算能力
归纳偏置
人工智能未来
多任务学习
已摘要
阅读时间:13 分钟(4256 个字)
3 summary versions
2024-05-30 | Stanford CS25: V4 I From Large Language Models to Large Multimodal Models
2025-05-18 15:43
大型语言模型 (LLM)
大型多模态模型 (LMM)
Transformer架构
深度学习训练技术
数据驱动AI
扩散模型
模型对齐 (Alignment)
计算机视觉
生成式AI
视频理解
CogVLM
Scaling Law
已摘要
阅读时间:13 分钟(4433 个字)
2 summary versions
Andrej Karpathy | Deep Dive into LLMs like ChatGPT
2025-05-17 22:01
大型语言模型
ChatGPT
预训练
微调
强化学习
分词
Transformer架构
幻觉
工具使用
Andrej Karpathy
多模态
上下文窗口
已摘要
阅读时间:21 分钟(7246 个字)
3 summary versions
2024-04-12 | 3Blue1Brown | Transformers (how LLMs work) explained visually
2025-05-14 10:31
大型语言模型
Transformer架构
生成式AI
注意力机制
词嵌入
文本生成
深度学习
GPT模型
词元化
概率分布
已摘要
阅读时间:12 分钟(3911 个字)
2 summary versions
Generative AI Interview Prep 2024: LLMs, Transformers [Crash Course for AI/ML Engineers]
2025-05-14 10:18
生成式AI
LLMs
Transformer架构
AI/ML面试
生成模型
判别模型
自注意力机制
多头注意力
位置编码
深度学习
已摘要
阅读时间:10 分钟(3291 个字)
2 summary versions
Stanford CS336 Language Modeling from Scratch | Spring 2025 | 03 Architectures, Hyperparameters
2025-05-13 16:59
语言模型
Transformer架构
大型语言模型
模型训练
训练稳定性
架构演进
层归一化
RMSNorm
旋转位置编码
SwiGLU
注意力机制
超参数
已摘要
阅读时间:9 分钟(3084 个字)
2 summary versions