音频媒体文件
标签搜索结果 for "Instruction Tuning"
应用深度学习 | ADL TA Recitation: LLM LoRA Training 大型语言模型太大怎么调整呢?
2025-06-07 14:18
大型语言模型
LoRA
QLoRA
参数高效微调
模型微调
模型量化
GPU显存优化
人工智能
Instruction Tuning
bfloat16
已摘要
阅读时间:5 分钟(1691 个字)
1 summary version
Stanford CS224N: NLP with Deep Learning | Spring 2024 | Lecture 15 - After DPO by Nathan Lambert
2025-05-16 20:47
LLM Alignment
DPO
RLHF
Post-training
Large Language Models
Preference Tuning
Instruction Tuning
Reward Modeling
Online Learning
Data Bottlenecks
NLP
AI Research
已摘要
阅读时间:14 分钟(4845 个字)
2 summary versions