音频媒体文件
标签搜索结果 for "人工智能"
BiliBili | IBM RethinkFun | 零基础学习强化学习算法:PPO
2025-06-01 22:14
强化学习
PPO算法
策略梯度
Actor-Critic
优势函数
GAE
重要性采样
离策略学习
人工智能
强化学习入门
已摘要
阅读时间:9 分钟(2807 个字)
1 summary version
LoRA (Low-Rank Adaptation) Intro By Google Engineer | LLM Parameter-Efficient Fine-Tuning
2025-05-31 20:13
LoRA
大语言模型
参数高效微调
模型微调
QLoRA
计算资源优化
人工智能
量化 (AI)
任务隔离
Adapter Tuning
DoRA
已摘要
阅读时间:9 分钟(3136 个字)
1 summary version
Trelis Research | Fine tuning Optimizations - DoRA, NEFT, LoRA+, Unsloth
2025-05-31 19:40
人工智能
大语言模型
微调优化
LoRA
DoRA
NEFT
LoRA+
Unsloth
参数高效微调
训练速度
模型性能
已摘要
阅读时间:8 分钟(2480 个字)
1 summary version
Stanford CS25: V5 I Large Language Model Reasoning, Denny Zhou of Google Deepmind
2025-05-27 21:30
人工智能
大型语言模型 (LLM)
LLM推理
思维链 (CoT)
解码策略
迭代式微调 (IFT)
自洽性 (Self-Consistency)
模型自改进
检索增强推理
提示工程
谷歌DeepMind
涌现能力
已摘要
阅读时间:11 分钟(3800 个字)
2 summary versions
CS-194 Eric Wallace Memorization in language models
2025-05-23 13:08
人工智能
大语言模型
模型记忆
隐私泄露
版权侵权
模型安全
成员推断
数据去重
差分隐私
越狱攻击
缓解策略
已摘要
阅读时间:8 分钟(2542 个字)
1 summary version
CS 194⧸294-196 (LLM Agents) - Lecture 3, Chi Wang and Jerry Liu
2025-05-23 13:04
LLM
AI代理
AutoGen
LlamaIndex
多智能体系统
检索增强生成
多模态AI
知识助手
智能体编程
工作流编排
人工智能
已摘要
阅读时间:9 分钟(2956 个字)
2 summary versions
CS 194⧸294-196 (LLM Agents) - Lecture 1, Denny Zhou
2025-05-23 12:59
人工智能
大型语言模型 (LLM)
LLM智能体
推理能力
思维链 (CoT)
提示策略
自洽性 (Self-Consistency)
少样本学习
模型局限性
多智能体系统
检索增强生成 (RAG)
已摘要
阅读时间:11 分钟(3527 个字)
2 summary versions
2023-09-20 | Stanford CS224N NLP with Deep Learning | Lecture 16 - Multimodal Deep Learning, Douwe Kiela
2025-05-20 23:43
多模态深度学习
自然语言处理
计算机视觉
人工智能
Transformer
对比学习
CLIP模型
基础模型
模型评估
多模态融合
已摘要
阅读时间:13 分钟(4213 个字)
1 summary version
2024-05-01 | Stanford CS25 V4 I Demystifying Mixtral of Experts
2025-05-20 13:31
人工智能
大语言模型
稀疏混合专家
Mixtral 8x7B
模型架构
推理效率
参数效率
模型可解释性
知识密集型任务
路由机制
开源模型
已摘要
阅读时间:12 分钟(3862 个字)
2 summary versions
2025-05-19 | 大摩宏观团队周度闭门会 | 邢自强
2025-05-20 11:42
人工智能
AI产业链
中美科技博弈
AI芯片
国产化替代
宏观经济
AI应用
技术创新
大模型
地缘政治
新质生产力
已摘要
阅读时间:12 分钟(3901 个字)
1 summary version