音频媒体文件

清除
标签搜索结果 for "机器学习"
DjangoCon Europe 25 | KEYNOTE: Django for Data Science: Deploying Machine Learning Models with Django
2025-06-21 18:42

Django与数据科学结合部署机器学习模型

数据科学 机器学习 模型部署 Django Web开发 Python 全栈数据科学 Scikit-learn Jupyter Notebook Web应用
已摘要 阅读时间:6 分钟(1825 个字) 2 summary versions
2025-06-17 | 费曼学徒冬瓜 | 暴拆逻辑回归: 它既没有逻辑, 也不是回归
2025-06-17 11:28

逻辑回归算法拆解:从线性模型到概率输出

逻辑回归 二分类 广义线性模型 Sigmoid函数 极大似然估计 对数几率 机器学习 连接函数 损失函数推导 算法原理 伯努利分布
已摘要 阅读时间:7 分钟(2123 个字) 1 summary version
【生成式AI时代下的机器学习(2025)】第十一讲:今天你想为 Foundation Model 装备哪些 Task Vector?浅谈神奇的 Model Merging 技术
2025-06-09 21:41

神奇的模型融合技术与应用探索

生成式AI 模型合并 任务向量 基础模型 机器学习 参数空间运算 机器忘却 稀疏微调 模块化AI 技能迁移
已摘要 阅读时间:8 分钟(2575 个字) 1 summary version
B站 | 微软Reactor_SH | 玩转 GitHub Copilot|面向 MLOps⧸数据科学家的 GitHub Copilot
2025-06-05 16:14

GitHub Copilot 助力 MLOps 与数据科学高效编程

GitHub Copilot MLOps 数据科学 AI编程助手 机器学习 数据预处理 特征工程 模型训练 模型评估 Pandas Scikit-learn 代码生成
已摘要 阅读时间:7 分钟(2186 个字) 1 summary version
Stanford CS224N: NLP w/ DL | Spring 2024 | Lecture 14 - Reasoning and Agents by Shikhar Murty
2025-05-16 21:03

该讲座主要探讨了语言模型在推理领域的应用。首先,讲座定义了推理是利用事实和逻辑得出答案的过程,并区分了演绎推理、归纳推理和溯因推理三种主要类型,同时提及形式与非形式推理,指出讲座重点关注多步骤的非形式演绎推理。 接着,讲座探讨了通过提示工程(prompting)引导大型语言模型进行推理的多种方法。其中包括“思维链”(Chain-of-Thought, CoT)提示,即引导模型在给出答案前生成推理步骤,可通过上下文示例或“让我们一步一步思考”等简单指令实现。“自洽性”(Self-Consistency)方法通过对同一问题采样多个推理路径和答案,并选取最常见答案来提升准确性,其效果优于简单模型集成。针对多步骤推理,提出了“由少至多”(Least-to-Most)提示法,它将复杂问题分解为子问题,模型逐步解决并整合答案,显示了其处理复杂推理的潜力,尽管其根本性优势尚待验证。 最后,讲座讨论了超越提示工程的策略,如通过知识蒸馏将推理能力赋予小型语言模型。以Orca模型为例,它通过微调使小型Llama模型模仿GPT-4生成的解释和推理过程。训练数据通过结合Flan V2等数据集的指令与GPT-4在特定系统提示下(如要求分步解释)生成的详尽回答来构建。讲座强调,相关领域的研究多为近三四年成果,尚有许多未解问题。

自然语言处理 (NLP) 大型语言模型 (LLMs) AI推理 AI智能体 提示工程 思维链 (CoT) 知识蒸馏 视觉语言模型 (VLMs) 机器学习 AI研究 模型评估
已摘要 阅读时间:14 分钟(4652 个字) 2 summary versions
Stanford CS224N: NLP with Deep Learning | Spring 2024 | Lecture 11 - Benchmarking by Yann Dubois
2025-05-16 20:35

该演讲主要讨论了机器学习领域中基准测试和评估的核心作用。主讲人Yann Dubois指出,评估贯穿模型从训练、开发、选择到部署及学术发表的整个生命周期,但不同阶段对评估方法(如速度、成本、可微性、可信度、任务相关性、指标绝对性)有不同侧重。学术基准测试(如MMLU)对推动领域进步至关重要,强调可复现性、标准化及长期有效性,而非指标的短期完美。演讲进一步区分了NLP中的两类评估任务:封闭式任务(如情感分析、文本蕴含),其答案固定,评估方法成熟;以及开放式任务(如文本生成),其答案多样,评估更复杂。

自然语言处理 机器学习 深度学习 基准测试 模型评估 大型语言模型 文本生成 文本分类 评估指标 数据污染 人工评估 LLM评估器
已摘要 阅读时间:14 分钟(4806 个字) 2 summary versions