151. 播客:模型是处理器,Harness 是 OS,逼自己把 token 用完,就是一种刻意练习

2026.05.29

·播客

刻意练习使用 AI

1. 一图甚千言

20260530_6.webp|704


20260530_7.webp|760

20260530_5.webp|648

2. 核心观点

  • 模型像处理器,Harness 更像 OS。
    • 模型决定智力上限。
    • Harness 决定模型能不能进入真实任务、真实环境和真实反馈。
    • 用户的粘性也更容易留在 Harness 上,因为记忆、上下文、工作流和资产都沉在这一层。
  • Return 的问题没有被解决,只是被推迟了。
    • Anthropic 和 Coding 收入上涨,说明客户愿意继续买 token。
    • 但真正的回报要看终端用户有没有更高利润、更低成本或新收入。
    • 生产端能力变强,不自动等于结果端价值兑现。
  • AI 应用创业的机会变大了,但跟风的价值更低了。
    • 模型能力增强,基础设施完善,应用能做的事情变多。
    • 但一群人同时做 agentic coding、垂直 SaaS、AI 硬件时,差异化会迅速消失。
    • 技术早期最危险的动作是为了稳妥去跟风。
  • AI 时代的产品指标会从注意力转向高质量任务。
    • 移动互联网优化 DAU、时长、投放和留存。
    • Agent 产品更应该看能不能持续完成有价值任务。
    • 大 DAU 产品未必是大机会,高质量任务可能更接近 AI 时代的真实价值。
  • 下一个字节级公司大概率长得不像字节。
    • 字节系创始人的能力很强,但上一代增长、组织、流量和推荐范式不一定能迁移。
    • 原来的护城河可能变成软肋。
    • AI 时代的关键动作,可能是把在字节学到的东西重新拆掉。

3. 有意思的观点

  • 为什么claude 要封掉 openclaw ?
    • 因为 Max 用户可能真的能消耗完 token
  • OpenCrow / OpenClaw 的价值不只是“能跑 Agent”。
    • 它有一种“养成系”的粘性:
      • 有记忆;
      • 能一起做事;
      • 有一点拟人感,但没有过度拟人;
      • 用户会自然想告诉它更多。
    • 原来是聊天,现在是一起合作,这个关联性强很多。
  • 蒸汽机的例子很有意思。
    • 第一个例子是智力阈值:
      • AI 智力从猫到 80、90 分很重要,但真正的价值要过某个阈值。
      • 水烧到 99 度没有蒸汽机,烧开以后才突然变成新生产力。
      • Coding Agent 也是这样,Claude 4 到 4.5/4.6 之间没有明显范式变化,但体验突然过了阈值
    • 第二个例子是组织变革:
      • 蒸汽机工厂围绕一根主轴组织,厂房是狭长的。
      • 电动机出现以后,动力可以通过电线分散,厂房才能变大、变扁平。
      • 厂房变了,流水线才出现。
      • 技术本身不会自动释放生产力,组织形态要跟着变。
    • 第三个例子是新工作产生:
      • 蒸汽机先用于矿井抽水。
      • 后来带动纺织机,衣服变多。
      • 衣服变多以后,人开始需要更多颜色。
      • 染料工业发展,再扩散到化工、汽油、塑料、化肥。
      • 新需求和新工作不是一开始就能想清楚,它是生产力溢出后的连锁反应。
  • “逼自己把 token 用完”这件事,其实跟播客中的刻意练习是同一个意思。
    • 雨森说他朋友每个月烧 1 万美金 token,不是因为一定能直接赚钱,而是在逼自己用 AI 解决各种问题。
      • 当然,还是因为有钱,我个人是很想花那 200美金 Max会员的,可惜零花钱不够
    • 扫描过期域名、看 AI 买回来什么域名、再给域名做东西,这很像 Omakase
      • 今天鱼市场有什么鱼,就做什么菜。
      • 今天 AI 给我什么输入,我就逼自己做一个东西。
    • 但要把 token 用完,本质上是逼自己多出题、多交付、多形成反馈
  • 还有一句很重要:
    • 你可以外包思考,但不能外包理解。
    • 雨森进一步说,思考可能也不能完全外包。
    • 如果长期用 AI 代替思考,大脑权重没有更新,理解就没有发生。

但部分好像不是这期播客里说的,想到了就写下来

4. 总结

  • AI 投资判断
    • 行业变化快,被打脸是常态。
    • 早期投资人要敢于形成强判断,也要随时根据新事实修正。
    • 2026 的 Return 问题没有消失
      • 只是因为 Coding 和 Anthropic 的增长被往后推迟。
    • OpenAI 的 C 端订阅、广告、电商变现没有想象中顺。
    • Anthropic 的 Coding 收入上涨说明客户愿意投入,但还没有证明终端用户真的赚回来了
  • 模型与 Harness
    • 头部模型差距还没有彻底拉开,阶段性领先会来回变化。
    • Coding 从垂直领域变成水平能力,它会影响办公室工作、研究、医疗、金融等更大范围。
    • 模型外面正在长出 harnesscontextruntimesandboxmemory 等层。
    • 好的 Harness 能让模型跑起来,也能收集真实任务数据,反过来训练模型。
    • 用户对 Harness 的粘性可能强过对模型的粘性,因为记忆、上下文和工作流沉在这一层。
  • AI 应用创业
    • 应用创业者机会变大,不是变小。
    • 模型能力增强、基础设施完善以后,应用能做的场景更多,开发门槛更低。
    • 技术早期要敢做通用产品,不要过早躲进垂直 SaaS。
    • 跟风项目最危险,尤其是大家都去做 agentic coding、可穿戴录音、AI 硬件的时候。
    • 真正值得投的是出题家,不是赛道里做一个更好版本的人。
  • AI 产品和商业模式
    • 移动互联网的关键指标是注意力,AI 产品的关键指标更像高质量任务。
    • DAU 不一定重要,用户是否愿意把重要任务交给你更重要。
    • 封闭 App 在移动互联网时代是护城河,在 AI 时代可能变成软肋。
    • 如果 Agent 无法访问你的信息,用户可能迁移到更开放的工具里。
    • 产品传播会更依赖“魔法体验”,而不是投放、补贴和传统增长套路。
  • 下一个字节
    • 字节系创始人能力很强,但字节打法本身也会变成惯性。
    • 下一个字节级公司大概率不靠吞噬注意力,不以大 DAU 为唯一目标。
    • AI 时代更可能出现持续完成任务的 Agent 工作系统
    • 真正的挑战是把上一代学到的东西重新拆掉。
  • 组织变化
    • AI native 创业公司在产品阶段会更小。
    • 写代码这部分会被 Agent 压缩,团队分工会更全栈。
    • 大公司推广 AI 的难点不是买工具,而是部门墙、权限、数据和旧流程。
    • 技术换了以后,组织方式也要跟着换,否则新技术会被旧结构吃掉。
  • 技术变革影响
    • 短期失业冲击不可避免,因为技术扩散速度太快。
    • 个人要学习 AI,也要探索 AI 难替代的领域
    • 长期会有新工作,但新工作需要时间从生产力溢出里长出来。
      • 或者成为了 AI 的一部分,去投资 AI 相关的领域
    • 人真正要练的是 agency
      • 问问题、出题、判断要做什么。
    • 思考和创新都需要刻意练习,不能全外包给 AI。

5. 金句

  • Strong Opinions, Weakly Held。
    • 大胆判断,随时修正。
  • 做早期投资,被打脸是常态;被打脸说明行业变化快,变化快说明机会多。
  • 不要被自己的观点所绑架,当观点形成的原因发生变化时,应调整自己的看法
    • 保持灵活思维很重要性,避免因固执己见而错失机会。
  • 在变化很快、机会很多的时候,最怕的是为了稳妥去跟风。
    • 是的,非常统一,变化才会带来机会
  • Harness 更像 OS,模型更像驱动 OS 的处理器
  • Chatbot 没有很好的数据飞轮,因为普通聊天很难给模型新的知识;Agentic 产品的真实任务轨迹更有训练价值。
  • AI 有点像外星人,来到了人类的数字世界。
  • 今天胜利的秘籍,可能就是下个时代的毒药。
  • 下一个字节跳动级的公司可能长得不像字节。
  • 思考需要刻意练习,创新也需要刻意练习

6. Strong Opinions, Weakly Held

  • 戴雨森第1集里把 2026 判断成 The Year of R,偏现实、回调、谨慎。
  • 半年后,Coding 收入和 Anthropic 的变化让一部分判断看起来被打脸。
  • 这里有一个很好的姿态:
    • 有明确判断。
    • 公开说出来。
    • 被现实反馈修正。
    • 不把自尊绑在原判断上。
  • 对投资人来说,这不是丢脸,而是获得反馈。
  • 对我自己也一样:
    • 写 note、做 general-agent-lab、判断 Agent 产品,都要敢于留下明确判断。
    • 后面错了再改。
    • 如果一直只写安全话,最后没有任何可复盘的东西。

7. Return 只是被推迟

  • 第一集的问题是:
    • AI 投入这么大,回报在哪里?
  • 这期的修正是:
    • Anthropic 和 Coding 的收入确实变化很大。
  • 但收入还不是最终答案。
    • Anthropic 收入,是客户投入。
    • 客户投入以后,还要看终端用户有没有赚回来。
    • 这条链路如果不能闭上,AI 投资的 Return 仍然没有被证明。
  • AI Coding 的变化最容易让人兴奋,因为反馈闭环短
    • 程序员能立刻感受到效率提升。
    • 公司也能立刻看到研发产能变化。
    • 能不能转成新产品、新需求、新收入?,仍然需要时间。
  • 非常同意:
    • 生产端提升,不等于结果端提升。
    • Codex 帮我写了更多代码,但现实是,这些代码能够真正产出价值吗?
      • 一个真正赚钱的产品背后有好多陪跑的产品

8. Harness 的位置

8.1. 模型外面正在长出很多层

  • 这期对 Harness 的描述很像我最近一直在看的东西:
    • model
    • harness
    • context
    • runtime
    • sandbox
    • memory
    • tool
    • permission
  • 以前说“套壳”容易把这一层说低了。
  • 现在看,壳已经不是简单 UI。
    • 它决定模型怎么拿上下文。
    • 它决定模型能不能调用工具。
    • 它决定任务轨迹能不能被记录。
    • 它决定数据能不能反哺模型。
    • 它决定用户为什么不换掉你

8.2. Harness 像 OS

  • 这期最像一句锚点的话:
    • Harness 更像 OS,模型更像处理器。
  • 处理器可以更换,OS 和应用生态会沉淀用户资产。
  • 放到 Agent 产品里:
    • Claude Code 里沉淀的是项目上下文、工具调用、用户习惯和任务轨迹。
    • Codex 里沉淀的是 workspace、权限、skills、memory、自动化和代码环境。
    • Cursor 里沉淀的是编辑器现场、项目索引、改代码路径和用户肌肉记忆
  • 所以模型公司当然有优势,但应用公司和 Harness 公司也不一定没机会。
  • 关键不只是“接了哪个模型”,而是有没有形成自己的工作环境和反馈飞轮

8.3. 对 general-agent-lab 的启示

  • general-agent-lab 是不是应该叙事更大一点?

9. Agent 产品的数据飞轮

  • Chatbot 的问题是聊天数据很杂。
    • 普通人聊天很难持续给模型贡献新知识。
    • 很多对话只是表达、搜索、闲聊和一次性问答。
  • Agentic 产品的数据更像真实生产轨迹。
    • 用户给了什么目标。
    • Agent 读了什么上下文。
    • 调了什么工具。
    • 哪一步失败。
    • 人在哪里接管。
    • 最后什么结果被接受。
  • 这类数据更接近可训练资产
  • 这也解释了为什么 Coding 先跑出来:
    • 代码有可执行反馈。
    • 测试能验收。
    • diff 能比较。
    • Git 能记录过程。
    • 用户更愿意把真实任务交进去。
  • 对我自己的OS 也是一样。
    • 只聊天,不会积累什么。
    • 把任务落到 osskillsautotools、Git diff、Issue、脚本和本地文件,才会留下可复用轨迹。

10. AI 应用创业的机会

10.1. 应用创业者机会变大

  • 模型更强以后,应用创业者能做的场景变多。
  • 基础设施更完善以后,应用开发门槛变低。
  • 大厂做应用创新反而慢,因为组织、品牌、已有产品和商业模式会约束它。
  • 所以这期的判断不是“模型公司吞掉一切”。
  • 更准确的说法是:
    • 模型公司会向下做。
    • 应用公司也会向上沉淀数据、模型和工作流。
    • 中间的 Harness 层会变得更厚。

10.2. 技术早期要敢做通用产品

  • 雨森这期很强调 Horizontal
  • 他的判断是,技术早期不要太快去做垂直。
    • 垂直看起来更安全。
    • 但垂直也更容易套回旧 SaaS。
    • 真正的新增生产力,往往来自更通用的使用方式。
  • Manus、Genspark、Claude Code、Codex 这类产品,一开始都不是传统垂直工具。
  • 这和我最近的判断也贴近:
    • 如果只是把旧流程加一个 AI bar,最后还是旧流程。
    • 如果能改变任务入口、上下文组织和执行方式,才可能长成新的工作系统。

10.3. 跟风项目最危险

  • 今年很多人都做 agentic coding,很容易变成同质化。
  • AI 硬件、录音可穿戴、垂直 SaaS 也容易出现类似问题。
  • 更好的创业者像“出题家”:
    • 有自己的问题意识。
    • 能提出不同看法。
    • 能在技术还没完全被共识化时提前探索。
  • 这点也提醒我:
    • 读源码不是为了证明自己懂热门词。
    • 做原型也不是为了补齐一个市场上已经有的分类。
    • 最后要回答自己的题。

11. AI 产品指标变了

20260530_4.webp

11.1. 从注意力到任务

  • 移动互联网时代的核心资产是用户注意力
    • DAU。
    • 时长。
    • 留存。
    • 推荐效率。
    • 投放获客。
  • AI 时代的核心指标会更偏向任务结果。
    • Agent 能不能持续完成高价值任务。
    • 用户能不能少操心。
    • 系统能不能把复杂工作跑完。
  • 这会改变产品判断:
    • 不一定要追大 DAU。
    • 不一定要让用户每天打开。
    • 关键是用户愿不愿意把重要任务托付给你。

11.2. 原护城河会变成软肋

  • 移动互联网时代,封闭 App 是护城河。
  • AI 时代,用户的 Agent 如果进不去这个 App,封闭就可能变成障碍。
  • 这句话很值得记:
    • 原来的护城河可能会变成你的软肋。
  • 对内容、工具和个人系统也一样。
    • 如果材料都散在不可读、不可调、不可自动化的地方,Agent 就只能猜。
    • 真正的私有系统,应该能被自己授权后的 Agent 稳定读取、调用和行动。

就拿企微和飞书这种B端IM来说,这一点很明显,飞书明显比企微开放

12. 下一个字节

  • 这期不是简单说“字节系创始人不行”。
  • 更准确的判断是:
    • 字节训练出来的人很强。
    • 但字节的成功范式也很强。
    • 强范式会带来惯性。
  • AI 时代如果继续套上一代打法,可能很难做出下一代公司。
    • 推荐流量。
    • 用户时长。
    • 强运营。
    • 大组织。
    • 数据增长飞轮。
  • 这些仍然有用,但不能自动迁移。
  • 下一个字节级公司可能有这些特征:
    • 不靠吞噬注意力。
    • 不以 DAU 为唯一目标。
    • 不把封闭生态当默认护城河。
    • 更像一组能持续完成任务的 Agent 工作系统。
    • 组织更小,分工更模糊,工具更强。
  • 这句话很狠:
    • 字节系创始人,要把在字节学的东西,自己颠覆自己。

13. 组织变化

  • AI native 创业公司在产品阶段会更小。
  • 写代码这部分会被 Agent 大幅压缩。
  • 分工会从瀑布式变成更全栈的小组或个人
    • 同一拨人负责问题定义。
    • 负责产品设计。
    • 负责前后端实现。
    • 负责测试上线。
    • 负责运营反馈。
  • 大公司推广 AI 的难点不只是买工具。
    • 部门墙会挡住 context。
    • 数据权限会挡住任务闭环
    • 旧流程会把 AI 限制在局部提效。
  • 这很像从蒸汽机到电动机:
    • 技术换了,工厂组织方式也要换。
    • 只把新机器塞进旧组织,效果会被旧结构吃掉。

14. 三个 AI 产品阶段

20260530_3.webp

  • 第一阶段:让人类拥有更多更好的 Agent。
    • Claude Code。
    • Codex。
    • Manus。
    • 各种能替人完成任务的产品。
  • 第二阶段:让 Agent 适应人类数字世界。
    • 支付。
    • 注册。
    • 浏览器访问。
    • API 调用。
    • 权限和身份。
  • 第三阶段:建设 Agent 专属数字世界。
    • Agent 之间的支付。
      • 可能都是一次次几分钱的支付
    • Agent 之间的协作。
    • Agent 友好的工具、协议和基础设施。
  • 我现在最关心的是第一阶段和第二阶段之间。
    • 让 Agent 真能干活。
    • 让它进入真实电脑、真实文件、真实系统。
    • 同时保留人的授权、验收和边界。

15. 启示

  • 以后判断 Agent 产品,先看它的 Harness。
    • 它给模型什么上下文。
    • 它给模型什么工具。
    • 它怎么做权限。
    • 它怎么沉淀记忆。
    • 它怎么处理长任务。
    • 它有没有真实反馈飞轮。
  • 不要只看模型榜单和发布会。
    • 头部模型差距会来回变化。
    • 真正稳定的差异,可能在产品、组织、数据和任务轨迹。
  • 做自己的工具也不要只追“看起来 AI native”。
    • 先看能不能解决一个高价值任务
    • 再看能不能留下轨迹。
    • 最后看能不能复用成 workflow 或 skill。
  • 个人也要刻意练习思考。
    • AI 可以帮我读、写、整理、编码。
    • 但判断、提问、取舍和出题不能完全外包。
    • 思考和创新也需要刻意练习。
  • 所以,一定要逼自己把所有token用完 ,这就是刻意练习

就这么一点token都用不完,怎么逼你思考,怎么逼你进步

16. 技术变革影响与应对

  • 技术扩散速度太快,失业很难避免。
    • AI 现在的扩散速度可能快过很多人重新学习和适应的速度。
    • 个人层面,学习 AI、锻炼使用 AI 的能力,已经是职业安全的一部分。
    • 谁能驾驭好 AI,谁就更不容易被替代。
  • 短期看,AI 毁灭旧价值的速度快过创造新价值的速度
    • 公司会因为 AI 变得更高效。
    • 个人会先感受到岗位被替代。
    • 程序员、知识工作者、内容生产者都会先被冲击。
    • 很多人和人之间打交道、需要信任和责任承担的事,还没那么容易被 AI 替代。
  • 社会层面,可能需要某种再分配。
    • UBI 是一种可能。
    • 税收也是一种可能。
    • 如果三星、海力士这类公司因为 AI 基建赚太多,社会会自然讨论怎么再分配这部分收益。
  • 长期仍然可以乐观,但新工作需要时间长出来。
    • 蒸汽机一开始只是矿井抽水。
    • 后来带动纺织业。
    • 纺织业带来染料需求。
    • 染料工业继续扩散成化工产业。
    • 新工作不是技术出现当天就能被命名,它需要生产力溢出、需求扩散和企业探索。
  • 这一次的问题是速度更快。
    • 工业革命有几十年的扩散时间。
    • AI 可能一年内就让一类工作明显变化。
    • 所以动荡会更大,人和职业、人和 AI 的关系都会被重新思考。
  • 教育里最重要的可能不是专业选择,而是 agency
    • taste 也可能被 AI 超越。
    • AI 很擅长解决已有数据分布内的问题。
    • 人更需要问出好问题,创造 out of distribution 的东西。
    • 做什么、为什么做、要改变什么现状,这些仍然要靠人逼自己想。
  • 对我自己的结论:
    • 不要把 AI 只当成外包劳动力。
    • 更要把它当成思想健身房。
    • 多问问题,多做稀奇古怪的小东西,多让自己产生真实反馈。
    • 刻意练习使用 AI,本质上是刻意练习提出问题和完成闭环。

17. 相关来源

播客地址: https://www.xiaoyuzhoufm.com/episode/6a15a2cbff7b9a8c0a5b953f
播客标题: 142. 雨森的创投观察第2集:Harness、下一个字节、2026大机会和Stanley Druckenmiller