音频媒体文件
2025-05-29 | 洪灏 | 大类资产最新观点
2025-06-02 23:49
大类资产配置
市场模式转换
美元周期
去美元化
美债收益率
黄金投资
中美经贸
全球资产再平衡
香港股市
中国A股
宏观策略
市场波动性
已摘要
阅读时间:13 分钟(4319 个字)
1 summary version
【通义时间】如何让Qwen2.5-VL更好地看见这个世界?
2025-06-02 10:39
Qwen-VL
多模态大模型
视觉理解
动态分辨率
视频理解
视觉Agent
文档智能
通用Grounding
SOTA
长上下文处理
已摘要
阅读时间:11 分钟(3728 个字)
1 summary version
2022-10-30 | Lex Fridman Podcast | Andrej Karpathy: Tesla AI, Self-Driving, Optimus, Aliens, and AGI
2025-06-02 10:26
人工智能
神经网络
深度学习
AGI
自动驾驶
Tesla AI
OpenAI
Andrej Karpathy
合成智能
Optimus
已摘要
阅读时间:21 分钟(7165 个字)
3 summary versions
AI Bites | LoRA (Low-rank Adaption of AI Large Language Models) for fine-tuning LLM models
2025-06-01 22:24
人工智能
LLM
LoRA
PEFT
模型微调
参数高效
低秩
低秩分解
Transformer注意力
推理无延迟
部署优化
权重合并
已摘要
阅读时间:6 分钟(1824 个字)
1 summary version
AI Bites | QLoRA paper explained (Efficient Finetuning of Quantized LLMs)
2025-06-01 22:22
QLoRA
LLM
模型微调
模型量化
显存优化
NF4
双重量化
分页优化器
人工智能
LoRA
单GPU训练
已摘要
阅读时间:6 分钟(1966 个字)
1 summary version
BiliBili | IBM RethinkFun | 三分钟学会大模型PEFT的LORA算法 lora_rank lora_alpha
2025-06-01 22:18
LoRA算法
参数高效微调
大模型
人工智能
深度学习
低秩适应
模型微调
权重矩阵
lora_rank
lora_alpha
计算效率
已摘要
阅读时间:4 分钟(1298 个字)
1 summary version
BiliBili | IBM RethinkFun | 零基础学习强化学习算法:PPO
2025-06-01 22:14
强化学习
PPO算法
策略梯度
Actor-Critic
优势函数
GAE
重要性采样
离策略学习
人工智能
强化学习入门
已摘要
阅读时间:9 分钟(2807 个字)
1 summary version
BiliBili | IBM RethinkFun | 大模型微调看这个视频就够了 SFT NEFTune
2025-06-01 22:09
SFT
指令微调
大语言模型
对话模板
仅答案微调
NEFTune
数据增强
损失掩码
TRL库
Llama 3.1
已摘要
阅读时间:6 分钟(1809 个字)
1 summary version
Stanford Webinar - Managing Team Performance
2025-06-01 20:13
团队绩效管理
领导力发展
组织心理学
人才战略
企业文化
领导同理心
领导者自我认知
恰到好处的管理
60-30-10模型
科技行业
人力资源管理
已摘要
阅读时间:18 分钟(6175 个字)
1 summary version
DeepSeek-V3 Explained by Google Engineer | Mixture of Experts | Multi-head Latent Attention | CUDA
2025-05-31 20:15
DeepSeek-V3
大语言模型 (LLM)
混合专家模型 (MoE)
多头潜在注意力 (MLA)
KV缓存优化
无辅助损失负载均衡
多词元预测 (MTP)
FP8混合精度训练
CUDA核心优化
推理性能优化
模型效率
已摘要
阅读时间:11 分钟(3504 个字)
1 summary version