音频媒体列表 - StreamSparkAI

Prompt Engineering Explained By Google Engineer | 100X Productivity With AI | Prompting Techniques

2025-06-15 21:06

Prompt工程核心技巧揭秘：解锁AI潜能的超级能力

Prompt Engineering 人工智能大型语言模型 (LLM) 思维链 (CoT) 检索增强生成 (RAG) ReAct框架角色提示 AI生产力多模态提示 LLM幻觉

已摘要阅读时间：10 分钟（3403 个字） 2 summary versions

Stanford CS25: V5 I Large Language Model Reasoning, Denny Zhou of Google Deepmind

2025-05-27 21:30

大型语言模型推理能力解析：从思维链到解码策略

人工智能大型语言模型 (LLM) LLM推理思维链 (CoT) 解码策略迭代式微调 (IFT) 自洽性 (Self-Consistency) 模型自改进检索增强推理提示工程谷歌DeepMind 涌现能力

已摘要阅读时间：11 分钟（3800 个字） 2 summary versions

CS 194⧸294-196 (LLM Agents) - Lecture 1, Denny Zhou

2025-05-23 12:59

LLM Agents与推理能力的前沿探索

人工智能大型语言模型 (LLM) LLM智能体推理能力思维链 (CoT) 提示策略自洽性 (Self-Consistency) 少样本学习模型局限性多智能体系统检索增强生成 (RAG)

已摘要阅读时间：11 分钟（3527 个字） 2 summary versions

2025-04-01 | Stanford CS25: V5 I Overview of Transformers

2025-05-18 15:29

讲座系统地介绍了transformers的基本原理与发展历程，内容包括词向量和上下文嵌入的演变、自注意力机制中查询、键和值的工作原理、位置编码与多头注意力的作用以及最终实现的模型架构。讲者阐述了大规模语言模型预训练的关键策略，如数据混合、两阶段训练以及与人类语言学习数据量对比带来的启示，并探讨了微调、链式思维推理、基于人类反馈的强化学习等后续优化方法。讲座还展示了transformers在自然语言处理、计算机视觉、语音、生物信息、机器人等多个领域的广泛应用，并展望了模型可解释性、终身学习、设备端部署和自我改进智能体的发展前景，同时提出了应对高计算成本和环境影响的挑战。

人工智能 (AI) Transformer 大型语言模型 (LLM) 预训练训练后策略思维链 (CoT) 强化学习 (RLHF) AI智能体数据策略模型可解释性持续学习通用人工智能 (AGI)

已摘要阅读时间：22 分钟（7621 个字） 2 summary versions

Stanford CS224N: NLP w/ DL | Spring 2024 | Lecture 14 - Reasoning and Agents by Shikhar Murty

2025-05-16 21:03

该讲座主要探讨了语言模型在推理领域的应用。首先，讲座定义了推理是利用事实和逻辑得出答案的过程，并区分了演绎推理、归纳推理和溯因推理三种主要类型，同时提及形式与非形式推理，指出讲座重点关注多步骤的非形式演绎推理。接着，讲座探讨了通过提示工程（prompting）引导大型语言模型进行推理的多种方法。其中包括“思维链”（Chain-of-Thought, CoT）提示，即引导模型在给出答案前生成推理步骤，可通过上下文示例或“让我们一步一步思考”等简单指令实现。“自洽性”（Self-Consistency）方法通过对同一问题采样多个推理路径和答案，并选取最常见答案来提升准确性，其效果优于简单模型集成。针对多步骤推理，提出了“由少至多”（Least-to-Most）提示法，它将复杂问题分解为子问题，模型逐步解决并整合答案，显示了其处理复杂推理的潜力，尽管其根本性优势尚待验证。最后，讲座讨论了超越提示工程的策略，如通过知识蒸馏将推理能力赋予小型语言模型。以Orca模型为例，它通过微调使小型Llama模型模仿GPT-4生成的解释和推理过程。训练数据通过结合Flan V2等数据集的指令与GPT-4在特定系统提示下（如要求分步解释）生成的详尽回答来构建。讲座强调，相关领域的研究多为近三四年成果，尚有许多未解问题。

自然语言处理 (NLP) 大型语言模型 (LLMs) AI推理 AI智能体提示工程思维链 (CoT) 知识蒸馏视觉语言模型 (VLMs) 机器学习 AI研究模型评估

已摘要阅读时间：14 分钟（4652 个字） 2 summary versions

音频媒体文件

Prompt Engineering Explained By Google Engineer | 100X Productivity With AI | Prompting Techniques

Stanford CS25: V5 I Large Language Model Reasoning, Denny Zhou of Google Deepmind

CS 194⧸294-196 (LLM Agents) - Lecture 1, Denny Zhou

2025-04-01 | Stanford CS25: V5 I Overview of Transformers

Stanford CS224N: NLP w/ DL | Spring 2024 | Lecture 14 - Reasoning and Agents by Shikhar Murty