音频媒体文件

2025-05-29 | 洪灏 | 大类资产最新观点
2025-06-02 23:49

洪灏:大类资产最新观点与市场波动分析

大类资产配置 市场模式转换 美元周期 去美元化 美债收益率 黄金投资 中美经贸 全球资产再平衡 香港股市 中国A股 宏观策略 市场波动性
已摘要 阅读时间:13 分钟(4319 个字) 1 summary version
【通义时间】如何让Qwen2.5-VL更好地看见这个世界?
2025-06-02 10:39

让Qwen2.5-VL更懂视觉世界

Qwen-VL 多模态大模型 视觉理解 动态分辨率 视频理解 视觉Agent 文档智能 通用Grounding SOTA 长上下文处理
已摘要 阅读时间:11 分钟(3728 个字) 1 summary version
2022-10-30 | Lex Fridman Podcast | Andrej Karpathy: Tesla AI, Self-Driving, Optimus, Aliens, and AGI
2025-06-02 10:26

AI研究与生物启发:从神经网络到宇宙探索

人工智能 神经网络 深度学习 AGI 自动驾驶 Tesla AI OpenAI Andrej Karpathy 合成智能 Optimus
已摘要 阅读时间:21 分钟(7165 个字) 3 summary versions
AI Bites | LoRA (Low-rank Adaption of AI Large Language Models) for fine-tuning LLM models
2025-06-01 22:24

LoRA:高效微调大语言模型的低秩适配方法

人工智能 LLM LoRA PEFT 模型微调 参数高效 低秩 低秩分解 Transformer注意力 推理无延迟 部署优化 权重合并
已摘要 阅读时间:6 分钟(1824 个字) 1 summary version
AI Bites | QLoRA paper explained (Efficient Finetuning of Quantized LLMs)
2025-06-01 22:22

QLoRA详解:高效微调量化大语言模型的三大创新技术

QLoRA LLM 模型微调 模型量化 显存优化 NF4 双重量化 分页优化器 人工智能 LoRA 单GPU训练
已摘要 阅读时间:6 分钟(1966 个字) 1 summary version
BiliBili | IBM RethinkFun | 三分钟学会大模型PEFT的LORA算法 lora_rank lora_alpha
2025-06-01 22:18

LORA算法原理与参数高效微调技巧

LoRA算法 参数高效微调 大模型 人工智能 深度学习 低秩适应 模型微调 权重矩阵 lora_rank lora_alpha 计算效率
已摘要 阅读时间:4 分钟(1298 个字) 1 summary version
BiliBili | IBM RethinkFun | 零基础学习强化学习算法:PPO
2025-06-01 22:14

零基础入门强化学习与PPO算法解析

强化学习 PPO算法 策略梯度 Actor-Critic 优势函数 GAE 重要性采样 离策略学习 人工智能 强化学习入门
已摘要 阅读时间:9 分钟(2807 个字) 1 summary version
BiliBili | IBM RethinkFun | 大模型微调看这个视频就够了 SFT NEFTune
2025-06-01 22:09

大模型微调核心技术解析

SFT 指令微调 大语言模型 对话模板 仅答案微调 NEFTune 数据增强 损失掩码 TRL库 Llama 3.1
已摘要 阅读时间:6 分钟(1809 个字) 1 summary version
Stanford Webinar - Managing Team Performance
2025-06-01 20:13

如何打造高效团队:领导力与管理策略

团队绩效管理 领导力发展 组织心理学 人才战略 企业文化 领导同理心 领导者自我认知 恰到好处的管理 60-30-10模型 科技行业 人力资源管理
已摘要 阅读时间:18 分钟(6175 个字) 1 summary version
DeepSeek-V3 Explained by Google Engineer | Mixture of Experts | Multi-head Latent Attention | CUDA
2025-05-31 20:15

DeepSeek V3技术解析:MoE架构与性能优化

DeepSeek-V3 大语言模型 (LLM) 混合专家模型 (MoE) 多头潜在注意力 (MLA) KV缓存优化 无辅助损失负载均衡 多词元预测 (MTP) FP8混合精度训练 CUDA核心优化 推理性能优化 模型效率
已摘要 阅读时间:11 分钟(3504 个字) 1 summary version