音频媒体文件

Vision Transformer (ViT) Explained By Google Engineer | MultiModal LLM | Diffusion
2025-06-15 21:05

视觉Transformer革新图像处理 多模态LLM新引擎

Vision Transformer (ViT) 计算机视觉 多模态LLM 自注意力机制 图像编码 深度学习 Transformer架构 CLIP模型 图像生成 Patch Embedding 全局上下文建模 人工智能
已摘要 阅读时间:13 分钟(4289 个字) 3 summary versions
2025-03-04 | Transformer Deep Dive with Google Engineer | Foundation of LLMs and Modern AI
2025-06-15 20:50

Transformer架构深度解析:从注意力机制到位置编码

人工智能 深度学习 自然语言处理 Transformer架构 LLM 注意力机制 位置编码 多头注意力 KV缓存 归一化技术 模型推理优化
已摘要 阅读时间:17 分钟(5776 个字) 3 summary versions
2025-04-24 | Anthropic | Lessons on AI agents from Claude Plays Pokemon
2025-06-11 14:50

AI代理如何通过玩《宝可梦》测试复杂任务处理能力

AI智能体 人工智能 Anthropic Claude 模型评测 长期记忆 游戏AI 工具使用 规划与推理 宝可梦
已摘要 阅读时间:8 分钟(2672 个字) 2 summary versions
2025-06-11 | Stanford CS336 | Language Modeling from Scratch | Spring 2025 | Lecture 13: Data 1
2025-06-11 11:49

数据:语言模型训练的核心要素

语言模型 LLM 模型训练 数据处理 预训练 指令微调 合成数据 Common Crawl 版权法 合理使用
已摘要 阅读时间:7 分钟(2385 个字) 2 summary versions
2025-05-18 | 马克的技术工作坊 | MCP 与 Function Calling 到底什么关系,以及为什么我认为大部分人的观点都是错误的
2025-06-10 19:15

Function Calling 与 MCP 的关系解析及共存原理

Function Calling MCP 大语言模型 (LLM) 工具调用 AI Agent 协议标准化 人工智能 OpenAI API 互补关系 AI应用开发
已摘要 阅读时间:6 分钟(1929 个字) 2 summary versions
2025-06-03 | AI Engineer | The Future of Qwen: A Generalist Agent Model — Junyang Lin, Alibaba Qwen
2025-06-10 12:49

Qwen3发布:全新混合思维模式与多模态能力升级

人工智能 Qwen大模型 Qwen3 通用智能体模型 强化学习 多模态大模型 混合思维模式 动态思维预算 MoE模型 开源大模型 上下文窗口扩展 多语言支持
已摘要 阅读时间:9 分钟(3127 个字) 2 summary versions
2024-08-17 | AI Engineer | Building with Anthropic Claude: Prompt Workshop with Zack Witten
2025-06-10 12:39

AI提示工程实战工作坊:优化技巧与案例解析

人工智能 Anthropic Claude 提示工程 大语言模型 Claude 3.5 Sonnet 少样本学习 思维链 JSON输出 XML标签 (提示) 模型幻觉 API集成 Artifacts (Anthropic)
已摘要 阅读时间:11 分钟(3750 个字) 2 summary versions
【生成式AI时代下的机器学习(2025)】第十一讲:今天你想为 Foundation Model 装备哪些 Task Vector?浅谈神奇的 Model Merging 技术
2025-06-09 21:41

神奇的模型融合技术与应用探索

生成式AI 模型合并 任务向量 基础模型 机器学习 参数空间运算 机器忘却 稀疏微调 模块化AI 技能迁移
已摘要 阅读时间:8 分钟(2575 个字) 1 summary version
【生成式AI导论 2024】第16讲:可以加速所有语言模型生成速度的神奇外挂 — Speculative Decoding
2025-06-09 21:31

Speculative Decoding加速语言模型生成技术解析

生成式AI 大语言模型 (LLM) Speculative Decoding 模型加速 生成速度优化 自回归生成 并行验证 预言家模型 无侵入式技术 计算资源换时间
已摘要 阅读时间:6 分钟(1751 个字) 2 summary versions
2024-11-13 | Google Prompting Essentials | Start Writing Prompts Like a Pro
2025-06-09 21:26

Google 课程教你五步高效提示技巧

生成式AI 提示词工程 Google 负责任的AI 人在回路 多模态提示 AI应用 Google Gemini AI幻觉 Few-shot Prompting
已摘要 阅读时间:6 分钟(2031 个字) 2 summary versions