151. 播客：模型是处理器，Harness 是 OS，逼自己把 token 用完，就是一种刻意练习

2026.05.29

播客时间： 2026-05-27
播客地址： https://www.xiaoyuzhoufm.com/episode/6a15a2cbff7b9a8c0a5b953f
播客标题： 142. 雨森的创投观察第2集：Harness、下一个字节、2026大机会和Stanley Druckenmiller

刻意练习使用 AI

1. 一图甚千言

20260530_6.webp|704

20260530_7.webp|760

20260530_5.webp|648

2. 核心观点

模型像处理器，Harness 更像 OS。
- 模型决定智力上限。
- Harness 决定模型能不能进入真实任务、真实环境和真实反馈。
- 用户的粘性也更容易留在 Harness 上，因为记忆、上下文、工作流和资产都沉在这一层。
Return 的问题没有被解决，只是被推迟了。
- Anthropic 和 Coding 收入上涨，说明客户愿意继续买 token。
- 但真正的回报要看终端用户有没有更高利润、更低成本或新收入。
- 生产端能力变强，不自动等于结果端价值兑现。
AI 应用创业的机会变大了，但跟风的价值更低了。
- 模型能力增强，基础设施完善，应用能做的事情变多。
- 但一群人同时做 agentic coding、垂直 SaaS、AI 硬件时，差异化会迅速消失。
- 技术早期最危险的动作是为了稳妥去跟风。
AI 时代的产品指标会从注意力转向高质量任务。
- 移动互联网优化 DAU、时长、投放和留存。
- Agent 产品更应该看能不能持续完成有价值任务。
- 大 DAU 产品未必是大机会，高质量任务可能更接近 AI 时代的真实价值。
下一个字节级公司大概率长得不像字节。
- 字节系创始人的能力很强，但上一代增长、组织、流量和推荐范式不一定能迁移。
- 原来的护城河可能变成软肋。
- AI 时代的关键动作，可能是把在字节学到的东西重新拆掉。

3. 有意思的观点

为什么claude 要封掉 openclaw ？
- 因为 Max 用户可能真的能消耗完 token
OpenCrow / OpenClaw 的价值不只是“能跑 Agent”。
- 它有一种“养成系”的粘性：
  - 有记忆；
  - 能一起做事；
  - 有一点拟人感，但没有过度拟人；
  - 用户会自然想告诉它更多。
- 原来是聊天，现在是一起合作，这个关联性强很多。
蒸汽机的例子很有意思。
- 第一个例子是智力阈值：
  - AI 智力从猫到 80、90 分很重要，但真正的价值要过某个阈值。
  - 水烧到 99 度没有蒸汽机，烧开以后才突然变成新生产力。
  - Coding Agent 也是这样，Claude 4 到 4.5/4.6 之间没有明显范式变化，但体验突然过了阈值。
- 第二个例子是组织变革：
  - 蒸汽机工厂围绕一根主轴组织，厂房是狭长的。
  - 电动机出现以后，动力可以通过电线分散，厂房才能变大、变扁平。
  - 厂房变了，流水线才出现。
  - 技术本身不会自动释放生产力，组织形态要跟着变。
- 第三个例子是新工作产生：
  - 蒸汽机先用于矿井抽水。
  - 后来带动纺织机，衣服变多。
  - 衣服变多以后，人开始需要更多颜色。
  - 染料工业发展，再扩散到化工、汽油、塑料、化肥。
  - 新需求和新工作不是一开始就能想清楚，它是生产力溢出后的连锁反应。
“逼自己把 token 用完”这件事，其实跟播客中的刻意练习是同一个意思。
- 雨森说他朋友每个月烧 1 万美金 token，不是因为一定能直接赚钱，而是在逼自己用 AI 解决各种问题。
  - 当然，还是因为有钱，我个人是很想花那 200美金 Max会员的，可惜零花钱不够
- 扫描过期域名、看 AI 买回来什么域名、再给域名做东西，这很像 Omakase：
  - 今天鱼市场有什么鱼，就做什么菜。
  - 今天 AI 给我什么输入，我就逼自己做一个东西。
- 但要把 token 用完，本质上是逼自己多出题、多交付、多形成反馈。
还有一句很重要：
- 你可以外包思考，但不能外包理解。
- 雨森进一步说，思考可能也不能完全外包。
- 如果长期用 AI 代替思考，大脑权重没有更新，理解就没有发生。

但部分好像不是这期播客里说的，想到了就写下来

4. 总结

AI 投资判断
- 行业变化快，被打脸是常态。
- 早期投资人要敢于形成强判断，也要随时根据新事实修正。
- 2026 的 Return 问题没有消失
  - 只是因为 Coding 和 Anthropic 的增长被往后推迟。
- OpenAI 的 C 端订阅、广告、电商变现没有想象中顺。
- Anthropic 的 Coding 收入上涨说明客户愿意投入，但还没有证明终端用户真的赚回来了。
模型与 Harness
- 头部模型差距还没有彻底拉开，阶段性领先会来回变化。
- Coding 从垂直领域变成水平能力，它会影响办公室工作、研究、医疗、金融等更大范围。
- 模型外面正在长出 harness、context、runtime、sandbox、memory 等层。
- 好的 Harness 能让模型跑起来，也能收集真实任务数据，反过来训练模型。
- 用户对 Harness 的粘性可能强过对模型的粘性，因为记忆、上下文和工作流沉在这一层。
AI 应用创业
- 应用创业者机会变大，不是变小。
- 模型能力增强、基础设施完善以后，应用能做的场景更多，开发门槛更低。
- 技术早期要敢做通用产品，不要过早躲进垂直 SaaS。
- 跟风项目最危险，尤其是大家都去做 agentic coding、可穿戴录音、AI 硬件的时候。
- 真正值得投的是出题家，不是赛道里做一个更好版本的人。
AI 产品和商业模式
- 移动互联网的关键指标是注意力，AI 产品的关键指标更像高质量任务。
- DAU 不一定重要，用户是否愿意把重要任务交给你更重要。
- 封闭 App 在移动互联网时代是护城河，在 AI 时代可能变成软肋。
- 如果 Agent 无法访问你的信息，用户可能迁移到更开放的工具里。
- 产品传播会更依赖“魔法体验”，而不是投放、补贴和传统增长套路。
下一个字节
- 字节系创始人能力很强，但字节打法本身也会变成惯性。
- 下一个字节级公司大概率不靠吞噬注意力，不以大 DAU 为唯一目标。
- AI 时代更可能出现持续完成任务的 Agent 工作系统。
- 真正的挑战是把上一代学到的东西重新拆掉。
组织变化
- AI native 创业公司在产品阶段会更小。
- 写代码这部分会被 Agent 压缩，团队分工会更全栈。
- 大公司推广 AI 的难点不是买工具，而是部门墙、权限、数据和旧流程。
- 技术换了以后，组织方式也要跟着换，否则新技术会被旧结构吃掉。
技术变革影响
- 短期失业冲击不可避免，因为技术扩散速度太快。
- 个人要学习 AI，也要探索 AI 难替代的领域。
- 长期会有新工作，但新工作需要时间从生产力溢出里长出来。
  - 或者成为了 AI 的一部分，去投资 AI 相关的领域
- 人真正要练的是 agency：
  - 问问题、出题、判断要做什么。
- 思考和创新都需要刻意练习，不能全外包给 AI。

5. 金句

Strong Opinions, Weakly Held。
- 大胆判断，随时修正。
做早期投资，被打脸是常态；被打脸说明行业变化快，变化快说明机会多。
不要被自己的观点所绑架，当观点形成的原因发生变化时，应调整自己的看法
- 保持灵活思维很重要性，避免因固执己见而错失机会。
在变化很快、机会很多的时候，最怕的是为了稳妥去跟风。
- 是的，非常统一，变化才会带来机会
Harness 更像 OS，模型更像驱动 OS 的处理器。
Chatbot 没有很好的数据飞轮，因为普通聊天很难给模型新的知识；Agentic 产品的真实任务轨迹更有训练价值。
AI 有点像外星人，来到了人类的数字世界。
今天胜利的秘籍，可能就是下个时代的毒药。
下一个字节跳动级的公司可能长得不像字节。
思考需要刻意练习，创新也需要刻意练习。

6. Strong Opinions, Weakly Held

戴雨森第1集里把 2026 判断成 The Year of R，偏现实、回调、谨慎。
半年后，Coding 收入和 Anthropic 的变化让一部分判断看起来被打脸。
这里有一个很好的姿态：
- 有明确判断。
- 公开说出来。
- 被现实反馈修正。
- 不把自尊绑在原判断上。
对投资人来说，这不是丢脸，而是获得反馈。
对我自己也一样：
- 写 note、做 general-agent-lab、判断 Agent 产品，都要敢于留下明确判断。
- 后面错了再改。
- 如果一直只写安全话，最后没有任何可复盘的东西。

7. Return 只是被推迟

第一集的问题是：
- AI 投入这么大，回报在哪里？
这期的修正是：
- Anthropic 和 Coding 的收入确实变化很大。
但收入还不是最终答案。
- Anthropic 收入，是客户投入。
- 客户投入以后，还要看终端用户有没有赚回来。
- 这条链路如果不能闭上，AI 投资的 Return 仍然没有被证明。
AI Coding 的变化最容易让人兴奋，因为反馈闭环短。
- 程序员能立刻感受到效率提升。
- 公司也能立刻看到研发产能变化。
- 但能不能转成新产品、新需求、新收入？，仍然需要时间。
非常同意：
- 生产端提升，不等于结果端提升。
- Codex 帮我写了更多代码，但现实是，这些代码能够真正产出价值吗？
  - 一个真正赚钱的产品背后有好多陪跑的产品

8. Harness 的位置

8.1. 模型外面正在长出很多层

这期对 Harness 的描述很像我最近一直在看的东西：
- model
- harness
- context
- runtime
- sandbox
- memory
- tool
- permission
以前说“套壳”容易把这一层说低了。
现在看，壳已经不是简单 UI。
- 它决定模型怎么拿上下文。
- 它决定模型能不能调用工具。
- 它决定任务轨迹能不能被记录。
- 它决定数据能不能反哺模型。
- 它决定用户为什么不换掉你。

8.2. Harness 像 OS

这期最像一句锚点的话：
- Harness 更像 OS，模型更像处理器。
处理器可以更换，OS 和应用生态会沉淀用户资产。
放到 Agent 产品里：
- Claude Code 里沉淀的是项目上下文、工具调用、用户习惯和任务轨迹。
- Codex 里沉淀的是 workspace、权限、skills、memory、自动化和代码环境。
- Cursor 里沉淀的是编辑器现场、项目索引、改代码路径和用户肌肉记忆。
所以模型公司当然有优势，但应用公司和 Harness 公司也不一定没机会。
关键不只是“接了哪个模型”，而是有没有形成自己的工作环境和反馈飞轮。

8.3. 对 general-agent-lab 的启示

general-agent-lab 是不是应该叙事更大一点？

9. Agent 产品的数据飞轮

Chatbot 的问题是聊天数据很杂。
- 普通人聊天很难持续给模型贡献新知识。
- 很多对话只是表达、搜索、闲聊和一次性问答。
Agentic 产品的数据更像真实生产轨迹。
- 用户给了什么目标。
- Agent 读了什么上下文。
- 调了什么工具。
- 哪一步失败。
- 人在哪里接管。
- 最后什么结果被接受。
这类数据更接近可训练资产。
这也解释了为什么 Coding 先跑出来：
- 代码有可执行反馈。
- 测试能验收。
- diff 能比较。
- Git 能记录过程。
- 用户更愿意把真实任务交进去。
对我自己的OS 也是一样。
- 只聊天，不会积累什么。
- 把任务落到 os、skills、auto、tools、Git diff、Issue、脚本和本地文件，才会留下可复用轨迹。

10. AI 应用创业的机会

10.1. 应用创业者机会变大

模型更强以后，应用创业者能做的场景变多。
基础设施更完善以后，应用开发门槛变低。
大厂做应用创新反而慢，因为组织、品牌、已有产品和商业模式会约束它。
所以这期的判断不是“模型公司吞掉一切”。
更准确的说法是：
- 模型公司会向下做。
- 应用公司也会向上沉淀数据、模型和工作流。
- 中间的 Harness 层会变得更厚。

10.2. 技术早期要敢做通用产品

雨森这期很强调 Horizontal。
他的判断是，技术早期不要太快去做垂直。
- 垂直看起来更安全。
- 但垂直也更容易套回旧 SaaS。
- 真正的新增生产力，往往来自更通用的使用方式。
Manus、Genspark、Claude Code、Codex 这类产品，一开始都不是传统垂直工具。
这和我最近的判断也贴近：
- 如果只是把旧流程加一个 AI bar，最后还是旧流程。
- 如果能改变任务入口、上下文组织和执行方式，才可能长成新的工作系统。

10.3. 跟风项目最危险

今年很多人都做 agentic coding，很容易变成同质化。
AI 硬件、录音可穿戴、垂直 SaaS 也容易出现类似问题。
更好的创业者像“出题家”：
- 有自己的问题意识。
- 能提出不同看法。
- 能在技术还没完全被共识化时提前探索。
这点也提醒我：
- 读源码不是为了证明自己懂热门词。
- 做原型也不是为了补齐一个市场上已经有的分类。
- 最后要回答自己的题。

11. AI 产品指标变了

11.1. 从注意力到任务

移动互联网时代的核心资产是用户注意力。
- DAU。
- 时长。
- 留存。
- 推荐效率。
- 投放获客。
AI 时代的核心指标会更偏向任务结果。
- Agent 能不能持续完成高价值任务。
- 用户能不能少操心。
- 系统能不能把复杂工作跑完。
这会改变产品判断：
- 不一定要追大 DAU。
- 不一定要让用户每天打开。
- 关键是用户愿不愿意把重要任务托付给你。

11.2. 原护城河会变成软肋

移动互联网时代，封闭 App 是护城河。
AI 时代，用户的 Agent 如果进不去这个 App，封闭就可能变成障碍。
这句话很值得记：
- 原来的护城河可能会变成你的软肋。
对内容、工具和个人系统也一样。
- 如果材料都散在不可读、不可调、不可自动化的地方，Agent 就只能猜。
- 真正的私有系统，应该能被自己授权后的 Agent 稳定读取、调用和行动。

就拿企微和飞书这种B端IM来说，这一点很明显，飞书明显比企微开放

12. 下一个字节

这期不是简单说“字节系创始人不行”。
更准确的判断是：
- 字节训练出来的人很强。
- 但字节的成功范式也很强。
- 强范式会带来惯性。
AI 时代如果继续套上一代打法，可能很难做出下一代公司。
- 推荐流量。
- 用户时长。
- 强运营。
- 大组织。
- 数据增长飞轮。
这些仍然有用，但不能自动迁移。
下一个字节级公司可能有这些特征：
- 不靠吞噬注意力。
- 不以 DAU 为唯一目标。
- 不把封闭生态当默认护城河。
- 更像一组能持续完成任务的 Agent 工作系统。
- 组织更小，分工更模糊，工具更强。
这句话很狠：
- 字节系创始人，要把在字节学的东西，自己颠覆自己。

13. 组织变化

AI native 创业公司在产品阶段会更小。
写代码这部分会被 Agent 大幅压缩。
分工会从瀑布式变成更全栈的小组或个人。
- 同一拨人负责问题定义。
- 负责产品设计。
- 负责前后端实现。
- 负责测试上线。
- 负责运营反馈。
大公司推广 AI 的难点不只是买工具。
- 部门墙会挡住 context。
- 数据权限会挡住任务闭环。
- 旧流程会把 AI 限制在局部提效。
这很像从蒸汽机到电动机：
- 技术换了，工厂组织方式也要换。
- 只把新机器塞进旧组织，效果会被旧结构吃掉。

14. 三个 AI 产品阶段

第一阶段：让人类拥有更多更好的 Agent。
- Claude Code。
- Codex。
- Manus。
- 各种能替人完成任务的产品。
第二阶段：让 Agent 适应人类数字世界。
- 支付。
- 注册。
- 浏览器访问。
- API 调用。
- 权限和身份。
第三阶段：建设 Agent 专属数字世界。
- Agent 之间的支付。
  - 可能都是一次次几分钱的支付
- Agent 之间的协作。
- Agent 友好的工具、协议和基础设施。
我现在最关心的是第一阶段和第二阶段之间。
- 让 Agent 真能干活。
- 让它进入真实电脑、真实文件、真实系统。
- 同时保留人的授权、验收和边界。

15. 启示

以后判断 Agent 产品，先看它的 Harness。
- 它给模型什么上下文。
- 它给模型什么工具。
- 它怎么做权限。
- 它怎么沉淀记忆。
- 它怎么处理长任务。
- 它有没有真实反馈飞轮。
不要只看模型榜单和发布会。
- 头部模型差距会来回变化。
- 真正稳定的差异，可能在产品、组织、数据和任务轨迹。
做自己的工具也不要只追“看起来 AI native”。
- 先看能不能解决一个高价值任务。
- 再看能不能留下轨迹。
- 最后看能不能复用成 workflow 或 skill。
个人也要刻意练习思考。
- AI 可以帮我读、写、整理、编码。
- 但判断、提问、取舍和出题不能完全外包。
- 思考和创新也需要刻意练习。
所以，一定要逼自己把所有token用完 ，这就是刻意练习

就这么一点token都用不完，怎么逼你思考，怎么逼你进步

16. 技术变革影响与应对

技术扩散速度太快，失业很难避免。
- AI 现在的扩散速度可能快过很多人重新学习和适应的速度。
- 个人层面，学习 AI、锻炼使用 AI 的能力，已经是职业安全的一部分。
- 谁能驾驭好 AI，谁就更不容易被替代。
短期看，AI 毁灭旧价值的速度快过创造新价值的速度。
- 公司会因为 AI 变得更高效。
- 个人会先感受到岗位被替代。
- 程序员、知识工作者、内容生产者都会先被冲击。
- 很多人和人之间打交道、需要信任和责任承担的事，还没那么容易被 AI 替代。
社会层面，可能需要某种再分配。
- UBI 是一种可能。
- 税收也是一种可能。
- 如果三星、海力士这类公司因为 AI 基建赚太多，社会会自然讨论怎么再分配这部分收益。
长期仍然可以乐观，但新工作需要时间长出来。
- 蒸汽机一开始只是矿井抽水。
- 后来带动纺织业。
- 纺织业带来染料需求。
- 染料工业继续扩散成化工产业。
- 新工作不是技术出现当天就能被命名，它需要生产力溢出、需求扩散和企业探索。
这一次的问题是速度更快。
- 工业革命有几十年的扩散时间。
- AI 可能一年内就让一类工作明显变化。
- 所以动荡会更大，人和职业、人和 AI 的关系都会被重新思考。
教育里最重要的可能不是专业选择，而是 agency。
- taste 也可能被 AI 超越。
- AI 很擅长解决已有数据分布内的问题。
- 人更需要问出好问题，创造 out of distribution 的东西。
- 做什么、为什么做、要改变什么现状，这些仍然要靠人逼自己想。
对我自己的结论：
- 不要把 AI 只当成外包劳动力。
- 更要把它当成思想健身房。
- 多问问题，多做稀奇古怪的小东西，多让自己产生真实反馈。
- 刻意练习使用 AI，本质上是刻意练习提出问题和完成闭环。

1. 一图甚千言 ​

2. 核心观点 ​

3. 有意思的观点 ​

4. 总结 ​

5. 金句 ​

6. Strong Opinions, Weakly Held ​

7. Return 只是被推迟 ​

8. Harness 的位置 ​

8.1. 模型外面正在长出很多层 ​

8.2. Harness 像 OS ​

8.3. 对 general-agent-lab 的启示 ​

9. Agent 产品的数据飞轮 ​

10. AI 应用创业的机会 ​

10.1. 应用创业者机会变大 ​

10.2. 技术早期要敢做通用产品 ​

10.3. 跟风项目最危险 ​

11. AI 产品指标变了 ​

11.1. 从注意力到任务 ​

11.2. 原护城河会变成软肋 ​

12. 下一个字节 ​

13. 组织变化 ​

14. 三个 AI 产品阶段 ​

15. 启示 ​

16. 技术变革影响与应对 ​

1. 一图甚千言

2. 核心观点

3. 有意思的观点

4. 总结

5. 金句

6. Strong Opinions, Weakly Held

7. Return 只是被推迟

8. Harness 的位置

8.1. 模型外面正在长出很多层

8.2. Harness 像 OS

8.3. 对 general-agent-lab 的启示

9. Agent 产品的数据飞轮

10. AI 应用创业的机会

10.1. 应用创业者机会变大

10.2. 技术早期要敢做通用产品

10.3. 跟风项目最危险

11. AI 产品指标变了

11.1. 从注意力到任务

11.2. 原护城河会变成软肋

12. 下一个字节

13. 组织变化

14. 三个 AI 产品阶段

15. 启示

16. 技术变革影响与应对