音频媒体文件

LoRA (Low-Rank Adaptation) Intro By Google Engineer | LLM Parameter-Efficient Fine-Tuning
2025-05-31 20:13

LoRA技术详解:高效微调大模型的创新方法

LoRA 大语言模型 参数高效微调 模型微调 QLoRA 计算资源优化 人工智能 量化 (AI) 任务隔离 Adapter Tuning DoRA
已摘要 阅读时间:9 分钟(3136 个字) 1 summary version
Trelis Research | Fine tune Gemma 3, Qwen3, Llama 4, Phi 4 and Mistral Small with Unsloth and Transformers
2025-05-31 19:44

微调主流开源大模型:对比Unsloth与Transformers性能及技巧解析

大语言模型微调 Unsloth Transformers vLLM 开源大模型 LoRA 模型评估 数据准备 AI 性能对比
已摘要 阅读时间:9 分钟(3054 个字) 1 summary version
Trelis Research | Fine tuning Optimizations - DoRA, NEFT, LoRA+, Unsloth
2025-05-31 19:40

微调优化技术解析:DoRA、NEFT、LoRA+与Unsloth

人工智能 大语言模型 微调优化 LoRA DoRA NEFT LoRA+ Unsloth 参数高效微调 训练速度 模型性能
已摘要 阅读时间:8 分钟(2480 个字) 1 summary version
2025-05-28 | 大摩最新闭门会 为什么降息速度如此之慢?
2025-05-28 22:28

大摩闭门会解读利率政策与行业趋势

宏观经济 利率政策 供给侧改革 银行业 航空业 航司合作 定价策略 核能 能源政策 SMR 铀矿
已摘要 阅读时间:1 分钟(8 个字) 2 summary versions
Stanford CS25: V5 I Large Language Model Reasoning, Denny Zhou of Google Deepmind
2025-05-27 21:30

大型语言模型推理能力解析:从思维链到解码策略

人工智能 大型语言模型 (LLM) LLM推理 思维链 (CoT) 解码策略 迭代式微调 (IFT) 自洽性 (Self-Consistency) 模型自改进 检索增强推理 提示工程 谷歌DeepMind 涌现能力
已摘要 阅读时间:11 分钟(3800 个字) 2 summary versions
2025-05-26 | 大摩宏观策略谈 | 邢自强团队
2025-05-27 14:09

中国及全球经济展望与市场策略分析

全球经济 中国经济 市场策略 资产配置 通缩风险 贸易关税 货币政策 美联储 香港金融 结构性放缓 地缘政治
已摘要 阅读时间:13 分钟(4511 个字) 2 summary versions
CS-194 Eric Wallace Memorization in language models
2025-05-23 13:08

语言模型中的记忆效应:风险、检测与缓解策略

人工智能 大语言模型 模型记忆 隐私泄露 版权侵权 模型安全 成员推断 数据去重 差分隐私 越狱攻击 缓解策略
已摘要 阅读时间:8 分钟(2542 个字) 1 summary version
CS 194⧸294-196 (LLM Agents) - Lecture 3, Chi Wang and Jerry Liu
2025-05-23 13:04

未来AI应用与智能体编程:从自动化任务到多智能体协作

LLM AI代理 AutoGen LlamaIndex 多智能体系统 检索增强生成 多模态AI 知识助手 智能体编程 工作流编排 人工智能
已摘要 阅读时间:9 分钟(2956 个字) 2 summary versions
CS 194⧸294-196 (LLM Agents) - Lecture 2, Shunyu Yao
2025-05-23 12:59

AI安全与表征工程:风险、研究方向与应用探索

LLM LLM智能体 ReAct框架 推理与行动 智能体长时记忆 数字自动化 AI安全 表征工程 人机协同 智能体训练 智能体基准测试 工具使用 (AI)
已摘要 阅读时间:8 分钟(2473 个字) 2 summary versions
CS 194⧸294-196 (LLM Agents) - Lecture 1, Denny Zhou
2025-05-23 12:59

LLM Agents与推理能力的前沿探索

人工智能 大型语言模型 (LLM) LLM智能体 推理能力 思维链 (CoT) 提示策略 自洽性 (Self-Consistency) 少样本学习 模型局限性 多智能体系统 检索增强生成 (RAG)
已摘要 阅读时间:11 分钟(3527 个字) 2 summary versions