音频媒体文件
标签搜索结果 for "LLM"
FlashAttention V1 Deep Dive By Google Engineer | Fast and Memory-Efficient LLM Training
2025-06-15 21:21
FlashAttention
LLM
LLM训练优化
注意力机制
内存效率
I/O瓶颈
Tiling (分块)
Online Softmax
重计算 (Recomputation)
融合算子 (Fused Kernels)
已摘要
阅读时间:11 分钟(3816 个字)
2 summary versions
2025-03-04 | Transformer Deep Dive with Google Engineer | Foundation of LLMs and Modern AI
2025-06-15 20:50
人工智能
深度学习
自然语言处理
Transformer架构
LLM
注意力机制
位置编码
多头注意力
KV缓存
归一化技术
模型推理优化
已摘要
阅读时间:17 分钟(5776 个字)
3 summary versions
2025-06-11 | Stanford CS336 | Language Modeling from Scratch | Spring 2025 | Lecture 13: Data 1
2025-06-11 11:49
语言模型
LLM
模型训练
数据处理
预训练
指令微调
合成数据
Common Crawl
版权法
合理使用
已摘要
阅读时间:7 分钟(2385 个字)
2 summary versions
2025-05-30 | Y Combinator | State-Of-The-Art Prompting For AI Agents
2025-06-06 20:12
提示工程
AI代理
元提示
LLM
评估集
AI初创公司
垂直AI
前线部署工程师
AI客户支持
三层提示架构
已摘要
阅读时间:7 分钟(2230 个字)
1 summary version
Stanford CS336 Language Modeling from Scratch | Spring 2025 | Scaling laws 2
2025-06-04 13:29
LLM
缩放法则
µP (Maximal Update Parametrization)
超参数优化
模型训练优化
WSD学习率调度器
Chinchilla法则
计算效率
模型初始化
IsoFLOP分析
已摘要
阅读时间:12 分钟(4191 个字)
2 summary versions
Surprising Performance of SMALL Qwen3-A3B MoE
2025-06-04 11:15
AI
LLM
MoE
Qwen3-A3B
小模型性能
逻辑推理评测
推理过程透明性
自我纠错
模型局限性
非量化评测
已摘要
阅读时间:7 分钟(2243 个字)
1 summary version
AI Bites | LoRA (Low-rank Adaption of AI Large Language Models) for fine-tuning LLM models
2025-06-01 22:24
人工智能
LLM
LoRA
PEFT
模型微调
参数高效
低秩
低秩分解
Transformer注意力
推理无延迟
部署优化
权重合并
已摘要
阅读时间:6 分钟(1824 个字)
1 summary version
AI Bites | QLoRA paper explained (Efficient Finetuning of Quantized LLMs)
2025-06-01 22:22
QLoRA
LLM
模型微调
模型量化
显存优化
NF4
双重量化
分页优化器
人工智能
LoRA
单GPU训练
已摘要
阅读时间:6 分钟(1966 个字)
1 summary version
CS 194⧸294-196 (LLM Agents) - Lecture 3, Chi Wang and Jerry Liu
2025-05-23 13:04
LLM
AI代理
AutoGen
LlamaIndex
多智能体系统
检索增强生成
多模态AI
知识助手
智能体编程
工作流编排
人工智能
已摘要
阅读时间:9 分钟(2956 个字)
2 summary versions
CS 194⧸294-196 (LLM Agents) - Lecture 2, Shunyu Yao
2025-05-23 12:59
LLM
LLM智能体
ReAct框架
推理与行动
智能体长时记忆
数字自动化
AI安全
表征工程
人机协同
智能体训练
智能体基准测试
工具使用 (AI)
已摘要
阅读时间:8 分钟(2473 个字)
2 summary versions