音频媒体文件

清除
标签搜索结果 for "LLM"
FlashAttention V1 Deep Dive By Google Engineer | Fast and Memory-Efficient LLM Training
2025-06-15 21:21

FlashAttention V1 通过分块计算和在线 Softmax 技术优化注意力机制,显著提升大模型训练速度与内存效率。

FlashAttention LLM LLM训练优化 注意力机制 内存效率 I/O瓶颈 Tiling (分块) Online Softmax 重计算 (Recomputation) 融合算子 (Fused Kernels)
已摘要 阅读时间:11 分钟(3816 个字) 2 summary versions
2025-03-04 | Transformer Deep Dive with Google Engineer | Foundation of LLMs and Modern AI
2025-06-15 20:50

Transformer架构深度解析:从注意力机制到位置编码

人工智能 深度学习 自然语言处理 Transformer架构 LLM 注意力机制 位置编码 多头注意力 KV缓存 归一化技术 模型推理优化
已摘要 阅读时间:17 分钟(5776 个字) 3 summary versions
2025-06-11 | Stanford CS336 | Language Modeling from Scratch | Spring 2025 | Lecture 13: Data 1
2025-06-11 11:49

数据:语言模型训练的核心要素

语言模型 LLM 模型训练 数据处理 预训练 指令微调 合成数据 Common Crawl 版权法 合理使用
已摘要 阅读时间:7 分钟(2385 个字) 2 summary versions
2025-05-30 | Y Combinator | State-Of-The-Art Prompting For AI Agents
2025-06-06 20:12

AI代理提示工程的前沿实践与挑战

提示工程 AI代理 元提示 LLM 评估集 AI初创公司 垂直AI 前线部署工程师 AI客户支持 三层提示架构
已摘要 阅读时间:7 分钟(2230 个字) 1 summary version
Stanford CS336 Language Modeling from Scratch | Spring 2025 | Scaling laws 2
2025-06-04 13:29

Scaling Laws and Model Training Optimization in Large Language Models

LLM 缩放法则 µP (Maximal Update Parametrization) 超参数优化 模型训练优化 WSD学习率调度器 Chinchilla法则 计算效率 模型初始化 IsoFLOP分析
已摘要 阅读时间:12 分钟(4191 个字) 2 summary versions
Surprising Performance of SMALL Qwen3-A3B MoE
2025-06-04 11:15

小模型大表现:Qwen3-A3B MoE逻辑推理惊艳测试

AI LLM MoE Qwen3-A3B 小模型性能 逻辑推理评测 推理过程透明性 自我纠错 模型局限性 非量化评测
已摘要 阅读时间:7 分钟(2243 个字) 1 summary version
AI Bites | LoRA (Low-rank Adaption of AI Large Language Models) for fine-tuning LLM models
2025-06-01 22:24

LoRA:高效微调大语言模型的低秩适配方法

人工智能 LLM LoRA PEFT 模型微调 参数高效 低秩 低秩分解 Transformer注意力 推理无延迟 部署优化 权重合并
已摘要 阅读时间:6 分钟(1824 个字) 1 summary version
AI Bites | QLoRA paper explained (Efficient Finetuning of Quantized LLMs)
2025-06-01 22:22

QLoRA详解:高效微调量化大语言模型的三大创新技术

QLoRA LLM 模型微调 模型量化 显存优化 NF4 双重量化 分页优化器 人工智能 LoRA 单GPU训练
已摘要 阅读时间:6 分钟(1966 个字) 1 summary version
CS 194⧸294-196 (LLM Agents) - Lecture 3, Chi Wang and Jerry Liu
2025-05-23 13:04

未来AI应用与智能体编程:从自动化任务到多智能体协作

LLM AI代理 AutoGen LlamaIndex 多智能体系统 检索增强生成 多模态AI 知识助手 智能体编程 工作流编排 人工智能
已摘要 阅读时间:9 分钟(2956 个字) 2 summary versions
CS 194⧸294-196 (LLM Agents) - Lecture 2, Shunyu Yao
2025-05-23 12:59

AI安全与表征工程:风险、研究方向与应用探索

LLM LLM智能体 ReAct框架 推理与行动 智能体长时记忆 数字自动化 AI安全 表征工程 人机协同 智能体训练 智能体基准测试 工具使用 (AI)
已摘要 阅读时间:8 分钟(2473 个字) 2 summary versions