176. 播客：AI 时代的“五层蛋糕”、Token 经济学与被误解的泡沫

2026.06.09

播客时间： 2026-01-10
播客地址： https://www.xiaoyuzhoufm.com/episode/69621f04e235ea65bc1af989
播客标题： #388.对话黄仁勋：AI 时代的“五层蛋糕”、Token 经济学与被误解的泡沫

末日论者在晚宴上听起来聪明，而乐观主义者推动人类进步

1. 核心观点

工作的辩证法：任务（Task）与目的（Purpose）
- 任务是过程性操作，目的定义工作本质；AI 仅自动化任务，无法取代核心目的。
- 放射科医生启示：
  - AI 虽渗透 100% 读片任务，但读片效率提升降低了成本并刺激了潜在医疗需求，导致医生数量不降反升。
- 程序员启示：
  - 工程师的目的是解决问题，编码只是任务。
  - Cursor 释放了编码压力，让工程师能发现并解决更多问题。
- 任务随技术演变，目的是核心。逃避问题去重复做易被自动化的任务，终将被取代。
AI 基础设施基建与 Token 工厂效应
- AI 是每一次交互都实时生成的“Token 工厂”，而非编译分发的死软件。
- 催生芯片厂、超级计算机厂（整机架 GPU）和 AI 工厂三种大工业基建，拉动熟练工（电工、水管工、网络工程师）就业与薪资。
- 长期来看，自动驾驶和机器人车队的运行将催生庞大的物理维护与维修产业。
开源是实体工业与小团队的安全防线
- 开源是创新的底座，若无开源，垂直领域微调的传统企业和初创公司都将被闭源大厂壁垒扼杀。
- 否定“全知全能上帝 AI”的妄想，各行各业需要高度多样化、专业化的模型系统。
Token 经济学的暴降与算法通缩
- 2024 年推理成本暴降超 100 倍。在 Blackwell/Rubin 硬件、算法和架构的三重复合收益下，未来 10 年 Token 成本或降 10 亿倍。
- 摩尔定律硬件层面停滞，算力提升靠算法可编程性。这使落后半年的小团队依靠开源微调仍能进行差异化垂直竞争。
中美技术耦合与加速计算刚需
- 脱钩违背技术规律，中国开源贡献最大，中国互联网繁荣反哺了美国技术栈底层的芯片和 DRAM 产值。
- 通用计算向加速计算转型是摩尔定律终结后的必然。全球 2 万亿美元研发投入正从传统的物理 Wet Lab 大规模转向基于超级计算机的物理 AI 世界模型模拟。

2. 有意思的观点

末日论者的晚宴智慧 vs 乐观主义者的历史车轮
- 末日论者在晚宴上听起来聪明，而乐观主义者推动人类进步。
- 悲观论调助长防御性监管，但物理需求更强大。Token 边际成本下降使数百万个 AI 相互监控来构筑安全网，而不是失控。
DeepSeek 是对美国 AI 创新的巨大贡献
- 硅谷过去几年读过的最重要开源论文，让全美初创公司、AI 实验室和基础设施巨头全员受益。
- 技术无国界，全美顶尖 AI 研究员很多也是华裔，全球好点子不是由美国垄断的。
可编程架构击败专用 ASIC 芯片
- Transformer 架构（Attention 机制、SSM、混合架构如 Nitro）每年都在剧烈变化，专用 ASIC 极易被淘汰。
- 英伟达死守“可编程性”，是因为在晶体管物理极限时代，算力大跨越全靠算法，而支持一切算法的可编程兼容生态（CUDA）是最大装机量壁垒。
物理 AI 垂直化的“99.999%”法则
- 消费级 AI 容错高（90% 可用即神奇），工业与物理 AI 容错极低（90% 成功等同于 100% 不满意）。
- 这需要行业巨头（如 Caterpillar）利用行业 know-how 将核心技术做到 99.999% 的水平，未来 5 年是垂直 AI 的大爆发期。

3. 总结

AI技术栈的“五层蛋糕”模型
- 🍰 顶层：垂直应用（Applications）：
  - 具身智能（FSD、人形机器人）及行业工具（Cursor、Harvey、OpenEvidence）。
- 🍰 第四层：多样化模型（Models）：
  - 理解语言、生物、化学、量子物理等各种模态的多样化模型系统。
- 🍰 第三层：基础设施（Infrastructure）：
  - 数据中心、电力、土地及分布式编排软件栈。
- 🍰 第二层：加速芯片（Silicon）：
  - 提供可编程性与兼容生态的 GPU 等计算芯片。
- 🍰 底层：能源输入（Energy）：
  - 整个技术栈的物理底座。
自动驾驶演进的四个阶段
- ① 数字轨道时代：
  - 以 Mobilize/早期 ADAS 为代表，极其依赖人工规则与高精地图，车子行驶在死轨上。
- ② 深度学习模块化时代：
  - 拆分为感知、世界模型和规划，仅在感知层应用深度学习，模块间传递损耗大。
- ③ 端到端模型时代（E2E）：直
  - 接实现从输入到输出的黑盒数据驱动。
- ④ 推理端到端时代：结
  - 合推理系统，当车辆遇到分布外（OOD）全新情况时，能通过推理将其分解并逻辑导航通过。

4. 金句

末日论者是在晚宴上听起来很聪明的人，而乐观主义者是推动人类前进的人。
一份工作既有任务也有目的，要分清工作的目的和为完成工作所做的任务。
如果没有开源，今天所有的 AI 工作都会被扼杀。
未来的 5 年，大家焦点将是垂直化。
一个创造技术的人之所以能高谈阔论外科医生的生活，是因为他从来没当过外科医生。
没人想做搜索，他们想要答案；没人想做研究，他们想要答案。
最强大的军队是由最强大的经济体支撑的。
即使聊天机器人今天都不存在，英伟达仍然会是一家数千亿美元的公司，因为计算范式正从通用计算向加速计算转变。

5. 任务（Task）与目的（Purpose）的二重性

定义划分
- 任务（Task）：
  - 过程性、工具性操作（如看片子、读合同、打字、写代码）。
- 目的（Purpose）：
  - 核心价值和终极解决问题（如诊断疾病、保护客户、搞新研究、解决问题）。
传导机制
- AI 提升任务效率 $\rightarrow$ 降低单位成本 $\rightarrow$ 爆发潜在高弹性需求 $\rightarrow$ 最终创造出更多行业岗位。
核心启示
- 警惕把“调试接口、写长文档、整理工具”等容易被自动化替代的“任务”错当成核心建设。真正的护城河是解决目的的硬核能力。

6. 开源的护城河与“监管俘获”的阳谋

监管俘获（Regulatory Capture）的本质
- 闭源大厂向政府鼓吹末日论和安全限制，意在通过推高准入门槛和合规成本来扼杀新创公司与开源竞争。
交付栈优势
- 美国的国家优势不在于拥有一个垂直整合的“上帝模型”，而在于其拥有从芯片、基础设施到开源模型与行业应用这一整套多样化交付技术栈。

7. Token 经济学：通缩与可编程性优势

算法驱动的复合通缩
- Blackwell/Rubin 硬件、算法和架构的复合优化使推理成本年降数倍。
- 卡帕西估算三年前需数十亿美元的训练工作现在个人电脑一个周末即可搞定。
可编程架构的优势
- 英伟达坚守灵活编程（CUDA/NVLink）而非固定 ASIC，保证了 Flash Attention、SSM 等新兴算法能立刻在全球所有的 GPU 装机量上同步运行。
落后者的生存法则
- 极速通缩使得落后 6 个月的团队依靠开源，也能以千分之一的成本复制上一代前沿智力，在特定利基市场实现垂直突击。

8. 加速计算无泡沫与研发范式的物理漂移

加速计算的刚性替代
- 摩尔定律死后通用 CPU 算力停滞，而各行业数据爆发迫使计算范式从通用计算向加速计算转型，这是即使聊天机器人不存在依然真实的需求。
研发范式的物理漂移
- 全球每年 2 万亿美元的研发投入正在发生根本转变，从物理化学实实验室（Wet Lab）大规模采购离心机与试剂，漂移到采购 GPU 算力并建设超级计算机进行 AI 物理模拟（Dry Lab）。

9. 中美脱钩的幻觉与全球技术栈的循环

高度依赖的耦合关系
- 彻底脱钩是幼稚且违背常识的。中国为全球开源贡献最大，中国互联网产业增长为美芯片、DRAM 等各层注入了天量产值。
底层闭环循环
- 从中国开源研究中吸收灵感 $\rightarrow$ 通过美国底层技术栈交付繁荣 $\rightarrow$ 反哺和资助更强大的实体硬基建。

1. 核心观点 ​

2. 有意思的观点 ​

3. 总结 ​

4. 金句 ​

5. 任务（Task）与目的（Purpose）的二重性 ​

6. 开源的护城河与“监管俘获”的阳谋 ​

7. Token 经济学：通缩与可编程性优势 ​

8. 加速计算无泡沫与研发范式的物理漂移 ​

9. 中美脱钩的幻觉与全球技术栈的循环 ​

1. 核心观点

2. 有意思的观点

3. 总结

4. 金句

5. 任务（Task）与目的（Purpose）的二重性

6. 开源的护城河与“监管俘获”的阳谋

7. Token 经济学：通缩与可编程性优势

8. 加速计算无泡沫与研发范式的物理漂移

9. 中美脱钩的幻觉与全球技术栈的循环