音频媒体文件
标签搜索结果 for "大型语言模型"
应用深度学习 | ADL TA Recitation: LLM LoRA Training 大型语言模型太大怎么调整呢?
2025-06-07 14:18
大型语言模型
LoRA
QLoRA
参数高效微调
模型微调
模型量化
GPU显存优化
人工智能
Instruction Tuning
bfloat16
已摘要
阅读时间:5 分钟(1691 个字)
1 summary version
2025-06-06 | Stanford CS25: V5 | On the Biology of a Large Language Model, Josh Batson of Anthropic
2025-06-06 17:53
大型语言模型
机械可解释性
Anthropic
模型电路
稀疏自动编码器
抽象表征
并行计算
模型规划能力
AI安全
字典学习
模型行为分析
已摘要
阅读时间:10 分钟(3169 个字)
1 summary version
2024-04-11 | Stanford CS25: V4 Intuitions on Language Models
2025-05-18 15:58
人工智能
大型语言模型
Transformer架构
扩展定律
涌现能力
下一词预测
Decoder-Only模型
计算能力
归纳偏置
人工智能未来
多任务学习
已摘要
阅读时间:13 分钟(4256 个字)
3 summary versions
Andrej Karpathy | Deep Dive into LLMs like ChatGPT
2025-05-17 22:01
大型语言模型
ChatGPT
预训练
微调
强化学习
分词
Transformer架构
幻觉
工具使用
Andrej Karpathy
多模态
上下文窗口
已摘要
阅读时间:21 分钟(7246 个字)
3 summary versions
Stanford CS224N | 2023 | Lecture 10 - Prompting, Reinforcement Learning from Human Feedback
2025-05-16 21:06
大型语言模型
自然语言处理
提示工程
指令微调
RLHF
强化学习
零样本学习
少样本学习
链式思维
AI对齐
奖励模型
已摘要
阅读时间:14 分钟(4761 个字)
1 summary version
Stanford CS224N: NLP with Deep Learning | Spring 2024 | Lecture 11 - Benchmarking by Yann Dubois
2025-05-16 20:35
自然语言处理
机器学习
深度学习
基准测试
模型评估
大型语言模型
文本生成
文本分类
评估指标
数据污染
人工评估
LLM评估器
已摘要
阅读时间:14 分钟(4806 个字)
2 summary versions
Stanford CS224N: NLP with Deep Learning | Spring 2024 | Lecture 10 - Post-training by Archit Sharma
2025-05-15 22:42
大型语言模型
后训练
指令精调
RLHF
DPO
上下文学习
零样本学习
少样本学习
提示工程
AI对齐
规模法则
ChatGPT
已摘要
阅读时间:12 分钟(3939 个字)
2 summary versions
Stanford CS224N NLP with Deep Learning | Spring 2024 | Lecture 1 - Intro and Word Vectors
2025-05-15 13:21
自然语言处理
深度学习
词向量
Word2Vec
大型语言模型
Transformer
分布式语义学
斯坦福大学
CS224N
梯度下降
基础模型
已摘要
阅读时间:12 分钟(3929 个字)
1 summary version
2024 | Stanford CS229 I Machine Learning I Building Large Language Models (LLMs)
2025-05-14 13:38
大型语言模型
LLMs
预训练
后训练
RLHF
DPO
数据处理
模型评估
规模法则
系统优化
词元化
已摘要
阅读时间:10 分钟(3289 个字)
3 summary versions
2024-04-12 | 3Blue1Brown | Transformers (how LLMs work) explained visually
2025-05-14 10:31
大型语言模型
Transformer架构
生成式AI
注意力机制
词嵌入
文本生成
深度学习
GPT模型
词元化
概率分布
已摘要
阅读时间:12 分钟(3911 个字)
2 summary versions