音频媒体列表 - StreamSparkAI

2025-06-21 | Stanford CS336 | Language Modeling from Scratch | Spring 2025 | Lecture 15: Alignment - SFT/RLHF

2025-06-21 17:02

从 GPT-3 到 ChatGPT：RLHF 与语言模型对齐方法详解

模型对齐 RLHF 大语言模型 SFT (监督微调) DPO (直接偏好优化) 指令遵循 AI安全奖励模型 PPO

已摘要阅读时间：7 分钟（2314 个字） 2 summary versions

2024-08-17 | AI Engineer | Building with Anthropic Claude: Prompt Workshop with Zack Witten

2025-06-10 12:39

AI提示工程实战工作坊：优化技巧与案例解析

人工智能 Anthropic Claude 提示工程大语言模型 Claude 3.5 Sonnet 少样本学习思维链 JSON输出 XML标签 (提示) 模型幻觉 API集成 Artifacts (Anthropic)

已摘要阅读时间：11 分钟（3750 个字） 2 summary versions

2025-05-16 | Startup Ideas You Can Now Build With AI

2025-06-07 17:00

AI赋能创业新机遇：从招聘到教育的颠覆与突破

AI创业生成式AI 大语言模型商业模式创新招聘科技教育科技全栈服务 AI智能体平台中立性法律科技

已摘要阅读时间：6 分钟（1998 个字） 2 summary versions

应用深度学习 | 陈縕侬 | ADL 8.2: Parameter-Efficient Fine-Tuning (Adapter, LoRA) 如何低成本微调模型

2025-06-07 14:14

深度学习模型微调新方法：Adapter与LoRA的高效实践

参数高效微调大语言模型 LoRA Adapter Tuning 深度学习模型微调低成本微调低秩适配指令微调

已摘要阅读时间：6 分钟（1895 个字） 2 summary versions

2025-02-05 | Agentic AI: A Progression of Language Model Usage

2025-06-06 20:18

Agentic AI 语言模型的应用与设计模式解析

智能体AI 大语言模型检索增强生成 (RAG) 工具使用提示工程 ReAct框架多智能体协作模型幻觉 AI应用开发反思模式 (Reflection)

已摘要阅读时间：8 分钟（2680 个字） 1 summary version

B站 | 微软Reactor_SH | 玩转 GitHub Copilot | GitHub Copilot 使用技巧 - DevOps

2025-06-05 16:16

GitHub Copilot 企业定制与高效开发实战

GitHub Copilot AI Agent 企业定制 DevOps Semantic Kernel 大语言模型 AI编程软件开发生命周期多智能体编排 .NET Aspire VS Code扩展

已摘要阅读时间：9 分钟（2887 个字） 1 summary version

Qwen3-30B-A3B Mixture of Expert: Think Deeper, Act Faster - Install Locally

2025-06-04 11:12

Qwen3-30B-A3B Mixture of Expert模型本地安装与实测表现

Qwen3-30B-A3B MoE架构大语言模型本地部署性能评测人工智能 vLLM 逻辑推理多语言能力代码生成阿里巴巴

已摘要阅读时间：7 分钟（2405 个字） 1 summary version

Qwen3 30B-A3B MoE — In-Depth LOCAL Testing! (Think & No-Think)

2025-06-04 10:58

Qwen3 MoE模型实测：小参数超越大模型？

人工智能大语言模型 MoE模型 Qwen3 本地部署与测试模型性能评测参数效率代码生成量化技术采样策略 AI伦理

已摘要阅读时间：6 分钟（2024 个字） 2 summary versions

BiliBili | IBM RethinkFun | 大模型微调看这个视频就够了 SFT NEFTune

2025-06-01 22:09

大模型微调核心技术解析

SFT 指令微调大语言模型对话模板仅答案微调 NEFTune 数据增强损失掩码 TRL库 Llama 3.1

已摘要阅读时间：6 分钟（1809 个字） 1 summary version

LoRA (Low-Rank Adaptation) Intro By Google Engineer | LLM Parameter-Efficient Fine-Tuning

2025-05-31 20:13

LoRA技术详解：高效微调大模型的创新方法

LoRA 大语言模型参数高效微调模型微调 QLoRA 计算资源优化人工智能量化 (AI) 任务隔离 Adapter Tuning DoRA

已摘要阅读时间：9 分钟（3136 个字） 1 summary version

音频媒体文件