StreamSparkAI

音频媒体文件

标签搜索结果 for "推理无延迟"

AI Bites | LoRA (Low-rank Adaption of AI Large Language Models) for fine-tuning LLM models

2025-06-01 22:24

LoRA：高效微调大语言模型的低秩适配方法

人工智能 LLM LoRA PEFT 模型微调参数高效低秩低秩分解 Transformer注意力推理无延迟部署优化权重合并

已摘要阅读时间：6 分钟（1824 个字） 1 summary version