音频媒体文件

【通义时间】如何让Qwen2.5-VL更好地看见这个世界?
2025-06-02 10:39

让Qwen2.5-VL更懂视觉世界

已摘要 7727 字 1 个摘要版本
视频 科技
Qwen-VL 多模态大模型 视觉理解 动态分辨率 视频理解 视觉Agent 文档智能 通用Grounding SOTA 长上下文处理 +6
2022-10-30 | Lex Fridman Podcast | Andrej Karpathy: Tesla AI, Self-Driving, Optimus, Aliens, and AGI
2025-06-02 10:26

AI研究与生物启发:从神经网络到宇宙探索

已摘要 10068 字 3 个摘要版本
播客 科技 商业 管理
人工智能 神经网络 深度学习 AGI 自动驾驶 Tesla AI OpenAI Andrej Karpathy 合成智能 Optimus +6
AI Bites | LoRA (Low-rank Adaption of AI Large Language Models) for fine-tuning LLM models
2025-06-01 22:24

LoRA:高效微调大语言模型的低秩适配方法

已摘要 3449 字 1 个摘要版本
视频 科技
人工智能 LLM LoRA PEFT 模型微调 参数高效 低秩 低秩分解 Transformer注意力 推理无延迟 部署优化 权重合并 +8
AI Bites | QLoRA paper explained (Efficient Finetuning of Quantized LLMs)
2025-06-01 22:22

QLoRA详解:高效微调量化大语言模型的三大创新技术

已摘要 3585 字 1 个摘要版本
视频 科技
QLoRA LLM 模型微调 模型量化 显存优化 NF4 双重量化 分页优化器 人工智能 LoRA 单GPU训练 +7
BiliBili | IBM RethinkFun | 三分钟学会大模型PEFT的LORA算法 lora_rank lora_alpha
2025-06-01 22:18

LORA算法原理与参数高效微调技巧

已摘要 2365 字 1 个摘要版本
视频 科技
LoRA算法 参数高效微调 大模型 人工智能 深度学习 低秩适应 模型微调 权重矩阵 lora_rank lora_alpha 计算效率 +7
BiliBili | IBM RethinkFun | 零基础学习强化学习算法:PPO
2025-06-01 22:14

零基础入门强化学习与PPO算法解析

已摘要 6480 字 1 个摘要版本
视频 科技
强化学习 PPO算法 策略梯度 Actor-Critic 优势函数 GAE 重要性采样 离策略学习 人工智能 强化学习入门 +6
BiliBili | IBM RethinkFun | 大模型微调看这个视频就够了 SFT NEFTune
2025-06-01 22:09

大模型微调核心技术解析

已摘要 3825 字 1 个摘要版本
视频 科技
SFT 指令微调 大语言模型 对话模板 仅答案微调 NEFTune 数据增强 损失掩码 TRL库 Llama 3.1 +6
Stanford Webinar - Managing Team Performance
2025-06-01 20:13

如何打造高效团队:领导力与管理策略

已摘要 9798 字 1 个摘要版本
会议 管理 商业
团队绩效管理 领导力发展 组织心理学 人才战略 企业文化 领导同理心 领导者自我认知 恰到好处的管理 60-30-10模型 科技行业 人力资源管理 +7
DeepSeek-V3 Explained by Google Engineer | Mixture of Experts | Multi-head Latent Attention | CUDA
2025-05-31 20:15

DeepSeek V3技术解析:MoE架构与性能优化

已摘要 6735 字 1 个摘要版本
视频 科技
DeepSeek-V3 大语言模型 (LLM) 混合专家模型 (MoE) 多头潜在注意力 (MLA) KV缓存优化 无辅助损失负载均衡 多词元预测 (MTP) FP8混合精度训练 CUDA核心优化 推理性能优化 模型效率 +7
LoRA (Low-Rank Adaptation) Intro By Google Engineer | LLM Parameter-Efficient Fine-Tuning
2025-05-31 20:13

LoRA技术详解:高效微调大模型的创新方法

已摘要 5487 字 1 个摘要版本
视频 科技
LoRA 大语言模型 参数高效微调 模型微调 QLoRA 计算资源优化 人工智能 量化 (AI) 任务隔离 Adapter Tuning DoRA +7