音频媒体列表 - StreamSparkAI

BiliBili | IBM RethinkFun | 零基础学习强化学习算法：PPO

2025-06-01 22:14

零基础入门强化学习与PPO算法解析

强化学习 PPO算法策略梯度 Actor-Critic 优势函数 GAE 重要性采样离策略学习人工智能强化学习入门

已摘要阅读时间：9 分钟（2807 个字） 1 summary version

LoRA (Low-Rank Adaptation) Intro By Google Engineer | LLM Parameter-Efficient Fine-Tuning

2025-05-31 20:13

LoRA技术详解：高效微调大模型的创新方法

LoRA 大语言模型参数高效微调模型微调 QLoRA 计算资源优化人工智能量化 (AI) 任务隔离 Adapter Tuning DoRA

已摘要阅读时间：9 分钟（3136 个字） 1 summary version

Trelis Research | Fine tuning Optimizations - DoRA, NEFT, LoRA+, Unsloth

2025-05-31 19:40

微调优化技术解析：DoRA、NEFT、LoRA+与Unsloth

人工智能大语言模型微调优化 LoRA DoRA NEFT LoRA+ Unsloth 参数高效微调训练速度模型性能

已摘要阅读时间：8 分钟（2480 个字） 1 summary version

Stanford CS25: V5 I Large Language Model Reasoning, Denny Zhou of Google Deepmind

2025-05-27 21:30

大型语言模型推理能力解析：从思维链到解码策略

人工智能大型语言模型 (LLM) LLM推理思维链 (CoT) 解码策略迭代式微调 (IFT) 自洽性 (Self-Consistency) 模型自改进检索增强推理提示工程谷歌DeepMind 涌现能力

已摘要阅读时间：11 分钟（3800 个字） 2 summary versions

CS-194 Eric Wallace Memorization in language models

2025-05-23 13:08

语言模型中的记忆效应：风险、检测与缓解策略

人工智能大语言模型模型记忆隐私泄露版权侵权模型安全成员推断数据去重差分隐私越狱攻击缓解策略

已摘要阅读时间：8 分钟（2542 个字） 1 summary version

CS 194⧸294-196 (LLM Agents) - Lecture 3, Chi Wang and Jerry Liu

2025-05-23 13:04

未来AI应用与智能体编程：从自动化任务到多智能体协作

LLM AI代理 AutoGen LlamaIndex 多智能体系统检索增强生成多模态AI 知识助手智能体编程工作流编排人工智能

已摘要阅读时间：9 分钟（2956 个字） 2 summary versions

CS 194⧸294-196 (LLM Agents) - Lecture 1, Denny Zhou

2025-05-23 12:59

LLM Agents与推理能力的前沿探索

人工智能大型语言模型 (LLM) LLM智能体推理能力思维链 (CoT) 提示策略自洽性 (Self-Consistency) 少样本学习模型局限性多智能体系统检索增强生成 (RAG)

已摘要阅读时间：11 分钟（3527 个字） 2 summary versions

2023-09-20 | Stanford CS224N NLP with Deep Learning | Lecture 16 - Multimodal Deep Learning, Douwe Kiela

2025-05-20 23:43

多模态深度学习：NLP与图像融合前沿

多模态深度学习自然语言处理计算机视觉人工智能 Transformer 对比学习 CLIP模型基础模型模型评估多模态融合

已摘要阅读时间：13 分钟（4213 个字） 1 summary version

2024-05-01 | Stanford CS25 V4 I Demystifying Mixtral of Experts

2025-05-20 13:31

Mixtral 8x7B：稀疏专家混合模型解析

人工智能大语言模型稀疏混合专家 Mixtral 8x7B 模型架构推理效率参数效率模型可解释性知识密集型任务路由机制开源模型

已摘要阅读时间：12 分钟（3862 个字） 2 summary versions

2025-05-19 | 大摩宏观团队周度闭门会 | 邢自强

2025-05-20 11:42

中美科技博弈与AI产业链突围

人工智能 AI产业链中美科技博弈 AI芯片国产化替代宏观经济 AI应用技术创新大模型地缘政治新质生产力

已摘要阅读时间：12 分钟（3901 个字） 1 summary version

音频媒体文件