导出设置

预览

原始内容首次渲染后会自动收起,仅在需要时展开查看。

2025-02-28 | a16z Podcast | OpenClaw, Claude Code, and the Future of Software with Peter Yang

类型: 详细摘要 模型: gpt-5.4 创建时间: 2026-04-06 23:54

核心概览

本期对谈围绕 OpenClaw、编码代理与软件未来形态 展开。Peter Yang基于自己把OpenClaw接入Telegram、语音、记忆与工具调用后的长期使用,认为任务型应用的入口正在从打开单个App,转向给个人代理发消息;而编码代理的能力也已开始从写代码外溢到写文档、做演示、搭网站和处理更广泛的知识工作。主持人则补充,短期内更现实的变化不是岗位整体消失,而是团队显著缩小、软件构建成本逼近零、IDE从制作工具转向思考工具、工作中的大量协调摩擦被代理吸收。两人都认为这一趋势仍处于早期阶段:记忆系统会遗忘、配置复杂、自动化难以做到100%,但方向已经明确——未来产品需要同时服务人和代理,个人则更需要学习构建、试错、判断与快速迭代。

关键议题与详细总结

OpenClaw的实际使用方式与体验

  • Peter Yang表示,他较早接触并搭建了OpenClaw,虽然配置过程很折腾、很原始,但已经能为他完成多类任务:

    • 拉取YouTube等平台分析信息
    • 更新Google文档
    • 搭建简单网站
    • 通过消息或语音与他长期互动
  • 但他强调,自己最常用的并不是复杂自动化,而是把它当作一个可持续对话的个人代理

    • 主要通过Telegram文字和语音沟通
    • 通勤、睡前、散步时都会与之交流
    • 会让它基于记忆给出鼓励、复盘和个人洞察
  • 他举例称,OpenClaw曾基于长期记忆给他做过一段几分钟的鼓励式反馈,重点不是模型能不能输出这段话,而是它结合了他自己的上下文、长期记忆和移动消息界面,因此体验更像私人陪伴。

Peter Yang的核心感受"它感觉更像一个真正的人,而不是在用Claude或ChatGPT"("it feels more like a personal like actual human")

个人代理为何可能替代部分应用入口

  • Peter Yang认为,最先被削弱的不是所有应用,而是那些用户只是为了完成某个任务才打开的应用
  • 他的逻辑是:

    1. 用户原本打开App是为了执行任务
    2. 如果代理已接入相应工具或账户
    3. 那么直接给代理发消息往往比手动打开应用更省力
  • 他把这种体验类比为一个非常能干的行政助理

    • 用户不必自己逐步操作
    • 只需表达目标,代理再去协调完成
  • 不过他也明确区分了两类产品:

    • 任务型应用:更容易被代理替代入口
    • 娱乐型应用:短期内更可能继续被用户直接打开,因为它们承载的是情绪、消遣和沉浸感
  • 主持人进一步提出,很多人打开不同App,不只是为了办事,也是为了获得某种感受:

    • WhatsApp 是为了连接感
    • Slack 是为了生产感
    • TikTok 是为了娱乐感
  • Peter Yang对此的回应是,单一代理不一定要承载所有意图,因此他已经给自己的代理设置了多个Telegram频道,分别用于:

    • 随意语音交流
    • 与代理一起做项目
    • 对外演示,避免暴露私人信息

OpenClaw的关键短板:记忆与稳定性

  • 对于OpenClaw的记忆系统,Peter Yang的评价并不高。
  • 他理解中的默认方案,大致是:

    • 用Markdown文本文件存记忆
    • 按天更新
    • 容易遗忘关键事实和工具能力
  • 他举出的典型问题包括:

    • 明明已经赋予某项工具权限,代理却说自己做不了
    • 必须反复提醒它去查记忆
    • 即使有记忆,也不总会主动调用
  • 为了缓解这一点,他额外装了一个三层记忆方案和搜索工具,但也坦言自己并未完全弄清内部机制,只是感觉“比之前好一点”。

  • 他甚至把提醒写进代理配置文件中,要求代理在回答问题前先检查全部记忆。这说明当前阶段的实际可用性,仍然很依赖:

    • 用户主动配置
    • 提示词工程
    • 持续调试

工具接入、权限开放与隐私边界

  • Peter Yang对自己的代理开放程度很高:

    • 单独买了一台Mac Mini
    • 给代理单独设邮箱
    • 允许读取邮箱与日历
    • 允许写入部分文档
  • 这反映出当前个人代理的一个现实特征:想让它真正有用,就必须给它足够权限;但权限越大,风险越高

  • 他也明确承认,这类系统如果出错,理论上可能影响更大的文件与工作环境,因此现阶段仍需要谨慎隔离。

对ChatGPT、Claude Code与Codex的实际判断

  • Peter Yang直言,他对ChatGPT的一类体验非常不满:模型常在回答结尾附带额外推销式建议,例如再主动推荐还能做什么。
  • 他认为这可能有利于平台指标,但在真实使用中很烦、破坏自然感
  • 因此在日常偏好上,他已更倾向Claude生态;但在编码任务上,他仍会用Codex。

  • 两人对 Claude Code 与 Codex 的比较大致形成了以下共识:

    • Claude Code
      • 更健谈
      • 更适合流式、同步、较轻松的协作体验
      • 现阶段在截图粘贴、语音、浏览器联动等工具层细节上更顺手
    • Codex
      • 推理更扎实
      • 准确率常更高
      • 但等待时间更长,容易打断心流
  • 主持人总结为:Claude Code在使用体验与外围能力上更成熟,Codex在模型能力本身上可能更强,只是产品完成度还没跟上。

编码代理为何像老虎机

  • Peter Yang把编码代理形容为老虎机,主持人完全认同。
  • 两人给出的原因主要有两点:

    • 结果回报不稳定:有时很平庸,有时突然给出非常惊艳的结果
    • 等待时间不稳定:有时几秒,有时几分钟
  • 这种不确定性,会制造一种类似社交媒体或赌场的变动奖励机制,让人不断刷新、等待、再尝试。

  • 他们认为这既解释了编码代理的吸引力,也意味着未来产品设计需要面对新的心理与行为问题。

编码代理不只是写代码,而是在吞并知识工作

  • Peter Yang提出了整场最鲜明的判断:

"我感觉编程会吞掉几乎所有知识工作"("I feel like coding will eat all knowledge work")

  • 他的含义并不是人人都要学传统编程语言,而是:

    • 过去很多知识工作的输出形式是文档、PPT、表格、网页、流程
    • 这些工作正在被重新表达为可由代理操作、修改、生成的结构化任务
    • 因此,编码会从少数人的专业技能,变成普遍的生产表达方式
  • 他举了自己写博客的例子:

    • 不再从空白页开始
    • 先让Claude Code基于输入起草
    • 自己再对后半部分做细修

"我现在从不从零开始,总是先让AI给我前80%"("I never start from zero, like I always get the first 80% from AI")

  • 主持人补充了一个历史类比:Excel事实上早就是一种大规模普及的编程方式,只是人们通常不这样称呼它。未来编码代理会把这种能力放大很多倍,并扩展到看似更主观的写作、设计与分析任务中。

IDE从制作工具转向思考工具

  • 主持人提出一个重要判断:IDE正在从执行工具转向思考工具
  • 过去IDE主要负责把人写好的逻辑变成程序;现在由于代理可以执行大量实现工作,IDE逐渐变成:

    • 快速试错的环境
    • 生成多个候选方案的环境
    • 让人通过“做出来再看”来完善思路的环境
  • 他描述自己的工作流是:

    • 先快速让代理做一个很粗糙的版本
    • 持续逼近可运行状态
    • 再让代理回头写出本可采用的更优方案
    • 最后根据这些反馈重做结构
  • 在这个框架下,他认为Figma之类工具未必会被替代,因为它们除了用于执行设计,还承担设计思考与探索的功能。

SaaS会不会被替代

  • Peter Yang提到,有一家AI原生公司正在尝试让“vibe coders”构建内部工具,以替代团队正在付费使用的一批SaaS产品。
  • 这说明一个新趋势:当内部开发成本显著下降时,部分通用SaaS的购买理由会被削弱

  • 但主持人给出了重要反驳:

    • 很多SaaS本来就不贵
    • 自己维护一个替代品有持续成本
    • 对普通公司来说,不一定比每月付费更划算
  • 两人的相对一致结论是:

    • 简单、流程清晰、边界稳定的SaaS 更容易被替代
    • 复杂、长期维护价值高的SaaS 短期内仍有优势
    • Slack这类工具甚至可能继续重要,因为它也可能成为人与代理、代理与代理沟通的场所

产品、品牌与留存:代理时代的消费互联网逻辑会变

  • Peter Yang提出了一个面向消费产品的关键问题:

    • 如果用户不直接使用产品,而是让代理去调用产品
    • 那么留存、品牌、回访等传统指标该如何理解
  • 主持人的回答分两层:

    1. 旧消费互联网的很多复杂玩法,来自间接变现
      • 因为产品不直接收费,所以需要广告、网络效应、留存和参与度
    2. AI时代开始回到直接收费
      • 用户愿意为AI能力直接付费
      • 还出现了按使用量计费的消费模式
      • 推理成本客观存在,也逼着公司从第一天就清晰收费
  • 他据此判断,代理时代的产品可能有两套界面并存:

    • 一套是给代理调用的接口层
    • 一套是给人查看、干预、浏览、理解结果的界面层
  • 他举了两种使用方式并存的例子:

    • 有时用户仍想亲自看信用分变化与信用卡推荐
    • 有时只想直接问代理:这周你帮我优化了什么、帮我省了多少钱

未来公司形态:更小团队、更少协调、更少情绪摩擦

  • Peter Yang最强烈的组织判断是:公司越大,往往越容易变成低效、难受、对齐成本高的地方
  • 他用自己对大型公司会议与目标管理流程的不满来说明:

    • 很多时间花在对齐与讨论上
    • 而不是创造与交付上
  • 因此他希望未来更多公司保持极小规模:

    • 过去可能有10人产品团队
    • 未来可能只保留2到3个核心成员
    • 其余由代理承担大量支持工作
  • 主持人顺着这一点进一步认为,代理的价值不仅是提效,还可能提升工作的主观体验

    • 让高情绪冲突、拉扯式沟通、反复协商等工作从人转向代理
    • 让人类更多停留在目标设定、方向判断和最终决策层
  • 他甚至设想,未来如果两个团队需要谈判,可能是双方先派代理交涉,最后再由人确认结果。这样能减少很多人际博弈中的情绪负担。

PM、设计师与构建者角色变化

  • Peter Yang认为,很多产品经理其实真正想做的是创造产品,而不只是协调流程。
  • 他还提出两个相关判断:

    • 很多PM正在下班后学习或尝试vibe coding
    • 如果一个人暂时失业,反而可能获得更多时间去学习构建、试错与创业
  • 主持人则从自身经历回应,很多人会在职业路径中误以为PM更高阶,但最终发现:

    • 真正的满足感常来自亲手构建和交付
    • 单纯管理与协调未必能带来同样成就感
  • 不过两人也都承认,PM的某些核心能力不会消失,尤其是:

    • 与用户沟通
    • 识别真实问题
    • 判断该做什么
  • 只是未来这些人需要同时具备更强的构建能力,而不是只停留在文档与协调层。

  • 对设计师,两人的判断更偏向升级而非替代:

    • 设计师短期内仍然活跃在Figma等工具上
    • 但如果完全不学vibe coding,几年后可能会落后

节奏管理:不是一直更快,而是快慢结合

  • Peter Yang认为,当前AI工具太多、方向太杂,人很容易同时朝十个方向跑,因此有时必须放慢速度,重新确认目标。
  • 他同时也认为,传统那种年度规划、长周期僵化流程,已经越来越不适用于这种变化速度。

  • 主持人的观点更系统:

    • 在已经找准某个方向后,应该借助代理极快地爬上局部高点
    • 但在寻找下一个方向时,必须停下来、拉开距离、重新观察
  • 也就是说,未来有效的工作方式不是始终高速,而是高速实现 + 低速思考的组合。

小公司、个人创业与下一代教育路径

  • 两人都对更广泛的个人创业持乐观态度。
  • 主持人提到,即便一个产品的市场规模不够支撑传统风投逻辑,但如果它能服务一个足以让个人改善生活的细分市场,也仍然很有价值。
  • 他因此看好那些能让更多普通人建立“一人公司”或超小团队公司的工具。

  • Peter Yang把这一点直接延伸到对子女的期待:

    • 他希望自己的孩子在高中就能尝试推出小生意
    • 尽量绕过传统的大学—大公司路径
  • 主持人则回应,过去很多人担心孩子都想做YouTuber,但从积极角度看,那其实反映出新一代在追求自主、创造与创业。以前非程序员能在线上做的事有限,于是拍视频成了主要通道;现在AI正在把可构建的东西大幅扩展。

工作岗位会不会大规模消失

  • Peter Yang表达了一个朴素希望:即使AI会带来失业,最终也应让工作变得更有趣、更像创造。
  • 主持人则基于自己看公司的经验,给出了更细的拆分:

    • 第一类公司:把某岗位或团队的效率大幅提高,但无法完整替代整个工作
    • 第二类公司:真的把一个边界清晰的职能做到接近100%自动化,例如某些客服场景
  • 他的判断是,第二类其实很少见。绝大多数AI产品目前仍停留在大幅提效,而不是彻底替代。

  • 即便技术继续进步,经济结构更可能出现的是:

    • 超大公司缩编
    • 更多小公司、独立创业者和超精简团队出现
    • 工作形态变化,而不是总岗位数量必然减少
  • 他给出整场最明确的宏观判断:

"人类的野心没有天花板"("human ambition has no ceiling")

  • 换言之,只要人的欲望、兴趣和想做的新事不断增加,AI带来的生产力提升未必只会消灭工作,也可能创造更多新的工作与商业形态。

数据与统计信息汇总

  • 70%—80%:Peter Yang认为,OpenClaw价值主要来自更像人的消息与语音交互体验。
  • 80% / 20%:他写博客时通常先让AI完成约80%,自己再修改最后20%。
  • 10人降到2—3人:他预计未来产品团队会显著缩小,由代理补足执行能力。
  • 100%自动化罕见:主持人认为,大多数AI产品仍停留在提效,最后约10%仍常需人类完成。

决策与建议

  • Peter Yang已采取的做法

    • 为代理单独准备Mac Mini与邮箱,尽量做权限隔离。
    • 允许代理读取邮箱、日历并写入部分文档,以换取真实可用性。
    • 通过配置文件提醒代理先查记忆,再回答问题。
    • 为不同用途建立多个Telegram频道,分离私人交流、项目协作和公开演示。
  • 对个人能力的建议

    • 产品经理不应只停留在协调与写文档,应尽早学习构建、原型、vibe coding与快速验证。
    • 设计师应补上与AI协作的构建能力,否则可能在未来几年内落后。
    • 处理写作、文档、原型等工作时,可优先让AI产出初稿,再由人类做最后判断与修整。
  • 对组织与工作方式的建议

    • 尽量保持团队精简,把代理用于补充执行层与协调层工作。
    • 不要完全依赖旧式年度规划和冗长对齐流程。
    • 在执行已知方向时追求高速,在寻找新方向时保留慢思考和停顿空间。
  • 对产品与创业的建议

    • 产品设计需要同时考虑人类界面代理接口
    • 更小市场的产品也值得做,因为AI降低了构建成本,个人公司和小团队的成立门槛正在下降。

不确定性与待确认点

  • OpenClaw记忆系统的具体技术机制,Peter Yang本人也表示并未完全理解,相关描述存在[不确定]。
  • 多个Telegram频道之间是否共享上下文记忆,对谈中没有得到明确答案。
  • 任务型App会被替代到什么程度,双方只讨论了趋势,未给出确定时间表或范围。
  • Figma等设计工具能否长期保持核心地位,Peter Yang认为结论仍未定,主持人则给出偏乐观判断。
  • 岗位变化最终表现为失业、工时减少还是创业增加,两人倾向乐观,但承认路径与节奏仍不明朗。
  • 转录文本中部分技术名词和人名存在机器识别误差,个别细节可能有[内容不完整]或[不确定]之处。

结论回顾

  • 个人代理正在成为新的任务入口,而编码代理正从写代码扩展到更广泛的知识工作与内容生产。
  • 短期内更像是强增强而非彻底替代:团队会缩小、流程会重构、工具会重写,但完整自动化仍较少见。
  • 未来最关键的人类能力不是纯执行,而是方向判断、问题识别、审美取舍与持续构建。