音频媒体文件
2025-05-22 | WSJ | Eggs Are Still Expensive. Is This Company to Blame?
2025-05-23 09:43
鸡蛋生产
禽流感
鸡蛋价格上涨
市场供需
Cal-Maine
价格欺诈指控
司法调查
农产品市场
企业利润
已摘要
阅读时间:7 分钟(2131 个字)
1 summary version
Stanford CS336 Language Modeling from Scratch | Spring 2025 | Inference
2025-05-21 10:12
大语言模型
推理效率
Transformer模型
KV缓存优化
内存受限
模型量化
模型剪枝
推测采样
PagedAttention
替代架构
动态工作负载
计算强度
已摘要
阅读时间:9 分钟(2905 个字)
3 summary versions
2023-09-20 | Stanford CS224N NLP with Deep Learning | Lecture 16 - Multimodal Deep Learning, Douwe Kiela
2025-05-20 23:43
多模态深度学习
自然语言处理
计算机视觉
人工智能
Transformer
对比学习
CLIP模型
基础模型
模型评估
多模态融合
已摘要
阅读时间:13 分钟(4213 个字)
1 summary version
2024-05-01 | Stanford CS25 V4 I Demystifying Mixtral of Experts
2025-05-20 13:31
人工智能
大语言模型
稀疏混合专家
Mixtral 8x7B
模型架构
推理效率
参数效率
模型可解释性
知识密集型任务
路由机制
开源模型
已摘要
阅读时间:12 分钟(3862 个字)
2 summary versions
2025-05-23 | Stanford CS25 V4 I Behind the Scenes of LLM Pre-training: StarCoder Use Case
2025-05-20 13:14
大语言模型 (LLM)
LLM预训练
StarCoder
数据质量
开源LLM
规模法则 (Scaling Laws)
合成数据
数据筛选与处理
代码大语言模型
模型评估与基准
负责任AI开发
人工智能 (AI)
已摘要
阅读时间:14 分钟(4696 个字)
3 summary versions
2025-05-18 | 华创证券 张瑜团队 | 当下投资方式的否定与认定
2025-05-20 11:48
投资研判
宏观经济分析
中美贸易摩擦
关税影响
出口分析
美国通胀
全球需求
供应链风险
市场波动性
上市公司财报分析
转岗率
已摘要
阅读时间:16 分钟(5303 个字)
1 summary version
2025-05-19 | 大摩宏观团队周度闭门会 | 邢自强
2025-05-20 11:42
人工智能
AI产业链
中美科技博弈
AI芯片
国产化替代
宏观经济
AI应用
技术创新
大模型
地缘政治
新质生产力
已摘要
阅读时间:12 分钟(3901 个字)
1 summary version
2025-04-29 | WSJ Techfluential by Deloitte | Demystifying the CIO and Board Relationship
2025-05-20 10:04
CIO与董事会
技术领导力
企业技术治理
业务价值沟通
数字化转型
技术战略
CISO与董事会
高管影响力
董事会技术委员会
技术风险管理
继任者规划
保险科技
已摘要
阅读时间:11 分钟(3750 个字)
2 summary versions
2025 MIT | MIT 6.S191: Recurrent Neural Networks, Transformers, and Attention
2025-05-18 16:28
深度序列建模
循环神经网络 (RNN)
自注意力机制
Transformer 模型
大型语言模型 (LLMs)
自然语言处理 (NLP)
梯度问题
长期依赖
深度学习
MIT 6.S191
已摘要
阅读时间:9 分钟(3079 个字)
2 summary versions
MIT | Liquid AI | Introduction to LLM Post-Training
2025-05-18 16:19
LLM 后训练
监督微调
偏好对齐
大语言模型
模型微调
数据质量
模型合并
模型评估
测试时计算扩展
人工智能
参数高效微调
已摘要
阅读时间:16 分钟(5408 个字)
2 summary versions