音频媒体列表 - StreamSparkAI

2025-06-10 19:15

Function Calling 与 MCP 的关系解析及共存原理

Function Calling MCP 大语言模型 (LLM) 工具调用 AI Agent 协议标准化人工智能 OpenAI API 互补关系 AI应用开发

已摘要阅读时间：6 分钟（1929 个字） 2 summary versions

2025-06-09 21:31

Speculative Decoding加速语言模型生成技术解析

生成式AI 大语言模型 (LLM) Speculative Decoding 模型加速生成速度优化自回归生成并行验证预言家模型无侵入式技术计算资源换时间

已摘要阅读时间：6 分钟（1751 个字） 2 summary versions

2025-05-31 20:15

DeepSeek V3技术解析：MoE架构与性能优化

DeepSeek-V3 大语言模型 (LLM) 混合专家模型 (MoE) 多头潜在注意力 (MLA) KV缓存优化无辅助损失负载均衡多词元预测 (MTP) FP8混合精度训练 CUDA核心优化推理性能优化模型效率

已摘要阅读时间：11 分钟（3504 个字） 1 summary version

2025-05-20 13:14

Loubna Ben Allal在斯坦福CS25课程中分享了大语言模型（LLM）预训练背后的细节，以StarCoder为例探讨了训练高质量LLM所需的数据、模型架构与训练策略，并分析了开放与闭源模型的发展趋势及训练中的权衡问题。

大语言模型 (LLM) LLM预训练 StarCoder 数据质量开源LLM 规模法则 (Scaling Laws) 合成数据数据筛选与处理代码大语言模型模型评估与基准负责任AI开发人工智能 (AI)

已摘要阅读时间：14 分钟（4696 个字） 3 summary versions

音频媒体文件