音频媒体列表 - StreamSparkAI

音频媒体文件

标签搜索结果 for "LLM 后训练"

MIT | Liquid AI | Introduction to LLM Post-Training

2025-05-18 16:19

该转录内容阐述了大型语言模型在预训练后的后训练过程。讲者指出，预训练阶段仅使模型具备下一个令牌预测能力，而后训练则通过监督微调和偏好对齐两步，将基础模型转变为能理解指令、回答问题的实用助手。文中区分了通用微调、领域特定微调和任务特定微调三种方式，并说明了不同方式在数据规模和质量要求上的区别。讲解还涉及了何时采用微调技术，如改变回答语气、注入领域知识、模型蒸馏以及针对特定任务优化，同时强调了持续评估与迭代的重要性。最后，内容还总结了构建高质量数据集的三大要素：准确性、多样性和复杂性。

LLM 后训练监督微调偏好对齐大语言模型模型微调数据质量模型合并模型评估测试时计算扩展人工智能参数高效微调

已摘要阅读时间：16 分钟（5408 个字） 2 summary versions