StreamSparkAI
Summary
Notes
音频媒体文件
AI搜索
清除
标签搜索结果
for "推理无延迟"
AI Bites | LoRA (Low-rank Adaption of AI Large Language Models) for fine-tuning LLM models
2025-06-01 22:24
LoRA:高效微调大语言模型的低秩适配方法
人工智能
LLM
LoRA
PEFT
模型微调
参数高效
低秩
低秩分解
Transformer注意力
推理无延迟
部署优化
权重合并
已摘要
阅读时间:6 分钟(1824 个字)
1 summary version