音频媒体文件

清除
标签搜索结果 for "大语言模型"
2025-06-21 | Stanford CS336 | Language Modeling from Scratch | Spring 2025 | Lecture 15: Alignment - SFT/RLHF
2025-06-21 17:02

从 GPT-3 到 ChatGPT:RLHF 与语言模型对齐方法详解

模型对齐 RLHF 大语言模型 SFT (监督微调) DPO (直接偏好优化) 指令遵循 AI安全 奖励模型 PPO
已摘要 阅读时间:7 分钟(2314 个字) 2 summary versions
2024-08-17 | AI Engineer | Building with Anthropic Claude: Prompt Workshop with Zack Witten
2025-06-10 12:39

AI提示工程实战工作坊:优化技巧与案例解析

人工智能 Anthropic Claude 提示工程 大语言模型 Claude 3.5 Sonnet 少样本学习 思维链 JSON输出 XML标签 (提示) 模型幻觉 API集成 Artifacts (Anthropic)
已摘要 阅读时间:11 分钟(3750 个字) 2 summary versions
2025-05-16 | Startup Ideas You Can Now Build With AI
2025-06-07 17:00

AI赋能创业新机遇:从招聘到教育的颠覆与突破

AI创业 生成式AI 大语言模型 商业模式创新 招聘科技 教育科技 全栈服务 AI智能体 平台中立性 法律科技
已摘要 阅读时间:6 分钟(1998 个字) 2 summary versions
应用深度学习 | 陈縕侬 | ADL 8.2: Parameter-Efficient Fine-Tuning (Adapter, LoRA) 如何低成本微调模型
2025-06-07 14:14

深度学习模型微调新方法:Adapter与LoRA的高效实践

参数高效微调 大语言模型 LoRA Adapter Tuning 深度学习 模型微调 低成本微调 低秩适配 指令微调
已摘要 阅读时间:6 分钟(1895 个字) 2 summary versions
2025-02-05 | Agentic AI: A Progression of Language Model Usage
2025-06-06 20:18

Agentic AI 语言模型的应用与设计模式解析

智能体AI 大语言模型 检索增强生成 (RAG) 工具使用 提示工程 ReAct框架 多智能体协作 模型幻觉 AI应用开发 反思模式 (Reflection)
已摘要 阅读时间:8 分钟(2680 个字) 1 summary version
B站 | 微软Reactor_SH | 玩转 GitHub Copilot | GitHub Copilot 使用技巧 - DevOps
2025-06-05 16:16

GitHub Copilot 企业定制与高效开发实战

GitHub Copilot AI Agent 企业定制 DevOps Semantic Kernel 大语言模型 AI编程 软件开发生命周期 多智能体编排 .NET Aspire VS Code扩展
已摘要 阅读时间:9 分钟(2887 个字) 1 summary version
Qwen3-30B-A3B Mixture of Expert: Think Deeper, Act Faster - Install Locally
2025-06-04 11:12

Qwen3-30B-A3B Mixture of Expert模型本地安装与实测表现

Qwen3-30B-A3B MoE架构 大语言模型 本地部署 性能评测 人工智能 vLLM 逻辑推理 多语言能力 代码生成 阿里巴巴
已摘要 阅读时间:7 分钟(2405 个字) 1 summary version
Qwen3 30B-A3B MoE — In-Depth LOCAL Testing! (Think & No-Think)
2025-06-04 10:58

Qwen3 MoE模型实测:小参数超越大模型?

人工智能 大语言模型 MoE模型 Qwen3 本地部署与测试 模型性能评测 参数效率 代码生成 量化技术 采样策略 AI伦理
已摘要 阅读时间:6 分钟(2024 个字) 2 summary versions
BiliBili | IBM RethinkFun | 大模型微调看这个视频就够了 SFT NEFTune
2025-06-01 22:09

大模型微调核心技术解析

SFT 指令微调 大语言模型 对话模板 仅答案微调 NEFTune 数据增强 损失掩码 TRL库 Llama 3.1
已摘要 阅读时间:6 分钟(1809 个字) 1 summary version
LoRA (Low-Rank Adaptation) Intro By Google Engineer | LLM Parameter-Efficient Fine-Tuning
2025-05-31 20:13

LoRA技术详解:高效微调大模型的创新方法

LoRA 大语言模型 参数高效微调 模型微调 QLoRA 计算资源优化 人工智能 量化 (AI) 任务隔离 Adapter Tuning DoRA
已摘要 阅读时间:9 分钟(3136 个字) 1 summary version