音频媒体文件
标签搜索结果 for "零样本学习"
Stanford CS224N | 2023 | Lecture 10 - Prompting, Reinforcement Learning from Human Feedback
2025-05-16 21:06
大型语言模型
自然语言处理
提示工程
指令微调
RLHF
强化学习
零样本学习
少样本学习
链式思维
AI对齐
奖励模型
已摘要
阅读时间:14 分钟(4761 个字)
1 summary version
Stanford CS224N: NLP with Deep Learning | Spring 2024 | Lecture 10 - Post-training by Archit Sharma
2025-05-15 22:42
大型语言模型
后训练
指令精调
RLHF
DPO
上下文学习
零样本学习
少样本学习
提示工程
AI对齐
规模法则
ChatGPT
已摘要
阅读时间:12 分钟(3939 个字)
2 summary versions