音频媒体文件
Stanford CS224N | 2023 | Lecture 10 - Prompting, Reinforcement Learning from Human Feedback
2025-05-16 21:06
大型语言模型
自然语言处理
提示工程
指令微调
RLHF
强化学习
零样本学习
少样本学习
链式思维
AI对齐
奖励模型
已摘要
阅读时间:14 分钟(4761 个字)
1 summary version
Stanford CS224N: NLP w/ DL | Spring 2024 | Lecture 14 - Reasoning and Agents by Shikhar Murty
2025-05-16 21:03
自然语言处理 (NLP)
大型语言模型 (LLMs)
AI推理
AI智能体
提示工程
思维链 (CoT)
知识蒸馏
视觉语言模型 (VLMs)
机器学习
AI研究
模型评估
已摘要
阅读时间:14 分钟(4652 个字)
2 summary versions
Hardware-aware Algorithms for Sequence Modeling - Tri Dao | Stanford MLSys #87
2025-05-16 20:59
MLSys
硬件感知算法
序列建模
GPU内存
FlashAttention
注意力机制
Mamba模型
状态空间模型
长上下文
LLM推理
性能优化
已摘要
阅读时间:11 分钟(3649 个字)
2 summary versions
Stanford CS25: V2 I Introduction to Transformers w/ Andrej Karpathy
2025-05-16 20:54
Transformers
深度学习
自然语言处理
注意力机制
模型架构
人工智能
计算机视觉
GPT模型
上下文学习
AI发展史
计算效率
未来AI
已摘要
阅读时间:14 分钟(4802 个字)
3 summary versions
Stanford CS224N: NLP with Deep Learning | Spring 2024 | Lecture 15 - After DPO by Nathan Lambert
2025-05-16 20:47
LLM Alignment
DPO
RLHF
Post-training
Large Language Models
Preference Tuning
Instruction Tuning
Reward Modeling
Online Learning
Data Bottlenecks
NLP
AI Research
已摘要
阅读时间:14 分钟(4845 个字)
2 summary versions
Stanford CS224N: NLP w/ DL | Spring 2024 | Lecture 12 - Efficient Training, Shikhar Murty
2025-05-16 20:37
高效训练
深度学习训练
混合精度训练
BFloat16
分布式训练
FSDP
参数高效微调
LoRA
GPU显存优化
大规模模型训练
已摘要
阅读时间:9 分钟(3078 个字)
3 summary versions
Stanford CS224N: NLP with Deep Learning | Spring 2024 | Lecture 11 - Benchmarking by Yann Dubois
2025-05-16 20:35
自然语言处理
机器学习
深度学习
基准测试
模型评估
大型语言模型
文本生成
文本分类
评估指标
数据污染
人工评估
LLM评估器
已摘要
阅读时间:14 分钟(4806 个字)
2 summary versions
Stanford CS224N: NLP with Deep Learning | Spring 2024 | Lecture 10 - Post-training by Archit Sharma
2025-05-15 22:42
大型语言模型
后训练
指令精调
RLHF
DPO
上下文学习
零样本学习
少样本学习
提示工程
AI对齐
规模法则
ChatGPT
已摘要
阅读时间:12 分钟(3939 个字)
2 summary versions
Stanford CS224N: NLP with Deep Learning | Spring 2024 | Lecture 6 - Sequence to Sequence Models
2025-05-15 22:01
自然语言处理
深度学习
循环神经网络
LSTM
语言模型
困惑度
梯度消失
序列到序列模型
神经机器翻译
编码器-解码器模型
已摘要
阅读时间:9 分钟(3048 个字)
2 summary versions
Stanford CS224N NLP with Deep Learning | 2023 | Lecture 9 - Pretraining
2025-05-15 21:37
NLP
预训练
大语言模型
Transformer
子词建模
掩码语言建模
上下文学习
微调
BERT
GPT
思维链提示
已摘要
阅读时间:12 分钟(4127 个字)
2 summary versions