音频媒体文件
标签搜索结果 for "AI对齐"
2025-04-24 | Anthropic | Could AI models be conscious?
2025-06-07 19:47
AI意识
模型福祉
人工智能伦理
AI对齐
主观体验
全局工作空间理论
具身认知
AI安全
Anthropic
已摘要
阅读时间:9 分钟(2939 个字)
2 summary versions
2025-03-18 | Anthropic | Controlling powerful AI
2025-06-07 19:45
AI安全
AI控制
AI对齐
对齐伪装
风险管理
威胁建模
可信监控
欺骗性AI
Anthropic
机理可解释性
已摘要
阅读时间:7 分钟(2441 个字)
1 summary version
2025-04-08 | Stanford CS25: V5 I RL as a Co-Design of Product and Research, Karina Nguyen
2025-05-18 15:21
人工智能 (AI)
强化学习 (RL)
产品研究协同
大型语言模型 (LLM)
模型后训练
AI对齐
人机协作
合成数据
评估指标 (Evals)
奖励机制设计
生成式UI
创造力赋能
已摘要
阅读时间:22 分钟(7589 个字)
2 summary versions
Stanford CS224N | 2023 | Lecture 10 - Prompting, Reinforcement Learning from Human Feedback
2025-05-16 21:06
大型语言模型
自然语言处理
提示工程
指令微调
RLHF
强化学习
零样本学习
少样本学习
链式思维
AI对齐
奖励模型
已摘要
阅读时间:14 分钟(4761 个字)
1 summary version
Stanford CS224N: NLP with Deep Learning | Spring 2024 | Lecture 10 - Post-training by Archit Sharma
2025-05-15 22:42
大型语言模型
后训练
指令精调
RLHF
DPO
上下文学习
零样本学习
少样本学习
提示工程
AI对齐
规模法则
ChatGPT
已摘要
阅读时间:12 分钟(3939 个字)
2 summary versions