音频媒体列表 - StreamSparkAI

FlashAttention V1 Deep Dive By Google Engineer | Fast and Memory-Efficient LLM Training

2025-06-15 21:21

FlashAttention V1 通过分块计算和在线 Softmax 技术优化注意力机制，显著提升大模型训练速度与内存效率。

FlashAttention LLM LLM训练优化注意力机制内存效率 I/O瓶颈 Tiling (分块) Online Softmax 重计算 (Recomputation) 融合算子 (Fused Kernels)

已摘要阅读时间：11 分钟（3816 个字） 2 summary versions

2025-03-04 | Transformer Deep Dive with Google Engineer | Foundation of LLMs and Modern AI

2025-06-15 20:50

Transformer架构深度解析：从注意力机制到位置编码

人工智能深度学习自然语言处理 Transformer架构 LLM 注意力机制位置编码多头注意力 KV缓存归一化技术模型推理优化

已摘要阅读时间：17 分钟（5776 个字） 3 summary versions

2025-06-11 | Stanford CS336 | Language Modeling from Scratch | Spring 2025 | Lecture 13: Data 1

2025-06-11 11:49

数据：语言模型训练的核心要素

语言模型 LLM 模型训练数据处理预训练指令微调合成数据 Common Crawl 版权法合理使用

已摘要阅读时间：7 分钟（2385 个字） 2 summary versions

2025-05-30 | Y Combinator | State-Of-The-Art Prompting For AI Agents

2025-06-06 20:12

AI代理提示工程的前沿实践与挑战

提示工程 AI代理元提示 LLM 评估集 AI初创公司垂直AI 前线部署工程师 AI客户支持三层提示架构

已摘要阅读时间：7 分钟（2230 个字） 1 summary version

Stanford CS336 Language Modeling from Scratch | Spring 2025 | Scaling laws 2

2025-06-04 13:29

Scaling Laws and Model Training Optimization in Large Language Models

LLM 缩放法则 µP (Maximal Update Parametrization) 超参数优化模型训练优化 WSD学习率调度器 Chinchilla法则计算效率模型初始化 IsoFLOP分析

已摘要阅读时间：12 分钟（4191 个字） 2 summary versions

Surprising Performance of SMALL Qwen3-A3B MoE

2025-06-04 11:15

小模型大表现：Qwen3-A3B MoE逻辑推理惊艳测试

AI LLM MoE Qwen3-A3B 小模型性能逻辑推理评测推理过程透明性自我纠错模型局限性非量化评测

已摘要阅读时间：7 分钟（2243 个字） 1 summary version

AI Bites | LoRA (Low-rank Adaption of AI Large Language Models) for fine-tuning LLM models

2025-06-01 22:24

LoRA：高效微调大语言模型的低秩适配方法

人工智能 LLM LoRA PEFT 模型微调参数高效低秩低秩分解 Transformer注意力推理无延迟部署优化权重合并

已摘要阅读时间：6 分钟（1824 个字） 1 summary version

AI Bites | QLoRA paper explained (Efficient Finetuning of Quantized LLMs)

2025-06-01 22:22

QLoRA详解：高效微调量化大语言模型的三大创新技术

QLoRA LLM 模型微调模型量化显存优化 NF4 双重量化分页优化器人工智能 LoRA 单GPU训练

已摘要阅读时间：6 分钟（1966 个字） 1 summary version

CS 194⧸294-196 (LLM Agents) - Lecture 3, Chi Wang and Jerry Liu

2025-05-23 13:04

未来AI应用与智能体编程：从自动化任务到多智能体协作

LLM AI代理 AutoGen LlamaIndex 多智能体系统检索增强生成多模态AI 知识助手智能体编程工作流编排人工智能

已摘要阅读时间：9 分钟（2956 个字） 2 summary versions

CS 194⧸294-196 (LLM Agents) - Lecture 2, Shunyu Yao

2025-05-23 12:59

AI安全与表征工程：风险、研究方向与应用探索

LLM LLM智能体 ReAct框架推理与行动智能体长时记忆数字自动化 AI安全表征工程人机协同智能体训练智能体基准测试工具使用 (AI)

已摘要阅读时间：8 分钟（2473 个字） 2 summary versions

音频媒体文件