音频媒体文件
标签搜索结果 for "LLM推理"
2025-06-15 | 字节开源 AIBrix 基于vLLM的高性价比LLM推理加速方案
2025-06-17 09:41
AIBrix
LLM推理
vLLM
成本优化
性能优化
KV Cache优化
PD分离
LoRA
Kubernetes
云原生
开源
推理加速
已摘要
阅读时间:10 分钟(3361 个字)
1 summary version
Stanford CS25: V5 I Large Language Model Reasoning, Denny Zhou of Google Deepmind
2025-05-27 21:30
人工智能
大型语言模型 (LLM)
LLM推理
思维链 (CoT)
解码策略
迭代式微调 (IFT)
自洽性 (Self-Consistency)
模型自改进
检索增强推理
提示工程
谷歌DeepMind
涌现能力
已摘要
阅读时间:11 分钟(3800 个字)
2 summary versions
Hardware-aware Algorithms for Sequence Modeling - Tri Dao | Stanford MLSys #87
2025-05-16 20:59
MLSys
硬件感知算法
序列建模
GPU内存
FlashAttention
注意力机制
Mamba模型
状态空间模型
长上下文
LLM推理
性能优化
已摘要
阅读时间:11 分钟(3649 个字)
2 summary versions