音频媒体文件

清除
标签搜索结果 for "人工智能"
应用深度学习 | ADL TA Recitation: LLM LoRA Training 大型语言模型太大怎么调整呢?
2025-06-07 14:18

LLM训练技巧与LoRA方法解析

大型语言模型 LoRA QLoRA 参数高效微调 模型微调 模型量化 GPU显存优化 人工智能 Instruction Tuning bfloat16
已摘要 阅读时间:5 分钟(1691 个字) 1 summary version
Stanford CS336 | Language Modeling from Scratch | Spring 2025 | Lecture 12: Evaluation
2025-06-06 15:22

语言模型评估的多维视角与挑战

语言模型评估 人工智能 基准测试 评估危机 数据污染 安全性评估 智能体评估 Chatbot Arena MMLU 困惑度 指令遵循
已摘要 阅读时间:11 分钟(3703 个字) 2 summary versions
2025-05-21 | PyCon 2025 | Building AI Applications the Pydantic Way (Sponsor: Pydantic)
2025-06-05 22:19

构建AI应用的Pydantic之道

人工智能 Python Pydantic 生成式AI PydanticAI Pydantic Logfire Pydantic Evals 类型安全 可观测性 AI评估 模型上下文协议 (MCP) AI工程
已摘要 阅读时间:10 分钟(3273 个字) 1 summary version
B站 | 微软Reactor_SH | 玩转 GitHub Copilot|GitHub Copilot 使用技巧 - 项目架构
2025-06-05 16:18

GitHub Copilot 使用技巧与项目架构设计

GitHub Copilot AI辅助编程 项目架构 生成式AI 提示工程 软件开发生命周期 代码生成 开发效率 Copilot Chat Copilot Workspace 人工智能 软件开发
已摘要 阅读时间:8 分钟(2724 个字) 1 summary version
Qwen3-30B-A3B Mixture of Expert: Think Deeper, Act Faster - Install Locally
2025-06-04 11:12

Qwen3-30B-A3B Mixture of Expert模型本地安装与实测表现

Qwen3-30B-A3B MoE架构 大语言模型 本地部署 性能评测 人工智能 vLLM 逻辑推理 多语言能力 代码生成 阿里巴巴
已摘要 阅读时间:7 分钟(2405 个字) 1 summary version
Qwen3 30B-A3B MoE — In-Depth LOCAL Testing! (Think & No-Think)
2025-06-04 10:58

Qwen3 MoE模型实测:小参数超越大模型?

人工智能 大语言模型 MoE模型 Qwen3 本地部署与测试 模型性能评测 参数效率 代码生成 量化技术 采样策略 AI伦理
已摘要 阅读时间:6 分钟(2024 个字) 2 summary versions
2022-10-30 | Lex Fridman Podcast | Andrej Karpathy: Tesla AI, Self-Driving, Optimus, Aliens, and AGI
2025-06-02 10:26

AI研究与生物启发:从神经网络到宇宙探索

人工智能 神经网络 深度学习 AGI 自动驾驶 Tesla AI OpenAI Andrej Karpathy 合成智能 Optimus
已摘要 阅读时间:21 分钟(7165 个字) 3 summary versions
AI Bites | LoRA (Low-rank Adaption of AI Large Language Models) for fine-tuning LLM models
2025-06-01 22:24

LoRA:高效微调大语言模型的低秩适配方法

人工智能 LLM LoRA PEFT 模型微调 参数高效 低秩 低秩分解 Transformer注意力 推理无延迟 部署优化 权重合并
已摘要 阅读时间:6 分钟(1824 个字) 1 summary version
AI Bites | QLoRA paper explained (Efficient Finetuning of Quantized LLMs)
2025-06-01 22:22

QLoRA详解:高效微调量化大语言模型的三大创新技术

QLoRA LLM 模型微调 模型量化 显存优化 NF4 双重量化 分页优化器 人工智能 LoRA 单GPU训练
已摘要 阅读时间:6 分钟(1966 个字) 1 summary version
BiliBili | IBM RethinkFun | 三分钟学会大模型PEFT的LORA算法 lora_rank lora_alpha
2025-06-01 22:18

LORA算法原理与参数高效微调技巧

LoRA算法 参数高效微调 大模型 人工智能 深度学习 低秩适应 模型微调 权重矩阵 lora_rank lora_alpha 计算效率
已摘要 阅读时间:4 分钟(1298 个字) 1 summary version