音频媒体列表 - StreamSparkAI

应用深度学习 | ADL TA Recitation: LLM LoRA Training 大型语言模型太大怎么调整呢?

2025-06-07 14:18

LLM训练技巧与LoRA方法解析

大型语言模型 LoRA QLoRA 参数高效微调模型微调模型量化 GPU显存优化人工智能 Instruction Tuning bfloat16

已摘要阅读时间：5 分钟（1691 个字） 1 summary version

Stanford CS336 | Language Modeling from Scratch | Spring 2025 | Lecture 12: Evaluation

2025-06-06 15:22

语言模型评估的多维视角与挑战

语言模型评估人工智能基准测试评估危机数据污染安全性评估智能体评估 Chatbot Arena MMLU 困惑度指令遵循

已摘要阅读时间：11 分钟（3703 个字） 2 summary versions

2025-05-21 | PyCon 2025 | Building AI Applications the Pydantic Way (Sponsor: Pydantic)

2025-06-05 22:19

构建AI应用的Pydantic之道

人工智能 Python Pydantic 生成式AI PydanticAI Pydantic Logfire Pydantic Evals 类型安全可观测性 AI评估模型上下文协议 (MCP) AI工程

已摘要阅读时间：10 分钟（3273 个字） 1 summary version

B站 | 微软Reactor_SH | 玩转 GitHub Copilot｜GitHub Copilot 使用技巧 - 项目架构

2025-06-05 16:18

GitHub Copilot 使用技巧与项目架构设计

GitHub Copilot AI辅助编程项目架构生成式AI 提示工程软件开发生命周期代码生成开发效率 Copilot Chat Copilot Workspace 人工智能软件开发

已摘要阅读时间：8 分钟（2724 个字） 1 summary version

Qwen3-30B-A3B Mixture of Expert: Think Deeper, Act Faster - Install Locally

2025-06-04 11:12

Qwen3-30B-A3B Mixture of Expert模型本地安装与实测表现

Qwen3-30B-A3B MoE架构大语言模型本地部署性能评测人工智能 vLLM 逻辑推理多语言能力代码生成阿里巴巴

已摘要阅读时间：7 分钟（2405 个字） 1 summary version

Qwen3 30B-A3B MoE — In-Depth LOCAL Testing! (Think & No-Think)

2025-06-04 10:58

Qwen3 MoE模型实测：小参数超越大模型？

人工智能大语言模型 MoE模型 Qwen3 本地部署与测试模型性能评测参数效率代码生成量化技术采样策略 AI伦理

已摘要阅读时间：6 分钟（2024 个字） 2 summary versions

2022-10-30 | Lex Fridman Podcast | Andrej Karpathy: Tesla AI, Self-Driving, Optimus, Aliens, and AGI

2025-06-02 10:26

AI研究与生物启发：从神经网络到宇宙探索

人工智能神经网络深度学习 AGI 自动驾驶 Tesla AI OpenAI Andrej Karpathy 合成智能 Optimus

已摘要阅读时间：21 分钟（7165 个字） 3 summary versions

AI Bites | LoRA (Low-rank Adaption of AI Large Language Models) for fine-tuning LLM models

2025-06-01 22:24

LoRA：高效微调大语言模型的低秩适配方法

人工智能 LLM LoRA PEFT 模型微调参数高效低秩低秩分解 Transformer注意力推理无延迟部署优化权重合并

已摘要阅读时间：6 分钟（1824 个字） 1 summary version

AI Bites | QLoRA paper explained (Efficient Finetuning of Quantized LLMs)

2025-06-01 22:22

QLoRA详解：高效微调量化大语言模型的三大创新技术

QLoRA LLM 模型微调模型量化显存优化 NF4 双重量化分页优化器人工智能 LoRA 单GPU训练

已摘要阅读时间：6 分钟（1966 个字） 1 summary version

BiliBili | IBM RethinkFun | 三分钟学会大模型PEFT的LORA算法 lora_rank lora_alpha

2025-06-01 22:18

LORA算法原理与参数高效微调技巧

LoRA算法参数高效微调大模型人工智能深度学习低秩适应模型微调权重矩阵 lora_rank lora_alpha 计算效率

已摘要阅读时间：4 分钟（1298 个字） 1 summary version

音频媒体文件