翻译:Anthropic 内部如何通过 AI 变革工作方式
#2025/12/09
日期:2025年12月2日
原文链接: https://www.anthropic.com/research/how-ai-is-transforming-work-at-anthropic
目录
总结
- AI 使得工程师效率显著提升(生产力+50%)
- 工作内容向“全栈”扩展
- 并接手了更多复杂任务(如功能开发和架构设计)。
- 然而,这种转型也伴随着挑战:
- 工程师们担忧核心编码技能的退化
- 过度依赖 AI 导致的监督能力下降
- 以及职场中人际协作(如导师制)的减少
- Anthropic 正将自己作为“实验室”,探索适应 AI 时代的职业发展与技能培养新路径
核心摘要
AI 的使用正在从根本上改变软件开发者的工作性质,既带来了希望,也引发了担忧。
我们的研究揭示了一个正在经历重大转型的职场:
- 效率与广度提升:
- 工程师们完成的工作量大大增加,变得更加“全栈”(能够胜任原本专业领域之外的任务),学习和迭代速度加快,并开始处理以前被忽视的任务。
- 权衡与担忧:
- 这种工作广度的扩展也让人们思考其中的代价。
- 一些人担心这可能导致深层技术能力的丧失,或者变得无法有效监督 Claude 的输出;
- 而另一些人则拥抱这个机会,进行更广泛、更高维度的思考。
- 这种工作广度的扩展也让人们思考其中的代价。
- 协作模式改变:一些人发现,更多地与 AI 协作意味着与同事的协作减少;也有人担心自己最终会被自动化取代。
注:我们意识到,作为一家构建 AI 的公司, Anthropic 内部发生的事情可能是更广泛社会变革的先兆
主要发现 (Key Findings)
本节简要总结了来自调查、访谈和 Claude Code 数据的主要发现。
1. 调查数据 (Survey Data)
- 主要用途:
- Anthropic 的工程师和研究人员最常使用 Claude 来修复代码错误和了解代码库。
- 调试(Debugging)和代码理解是最常见的用途。
- 使用率与生产力:
- 员工自述在 60% 的工作中使用 Claude。
- 实现了 50% 的生产力提升,是去年同期的 2-3 倍。
- 这种生产力提升表现为:
- 每类任务花费的时间略有减少,但产出量显著增加。
- 新任务类型:
- 27% 由 Claude 辅助的工作属于“如果没有 AI 就不会做”的任务
- 例如扩展项目规模、制作锦上添花的工具(如交互式数据仪表盘)以及手工做不划算的探索性工作。
- 27% 由 Claude 辅助的工作属于“如果没有 AI 就不会做”的任务
- 人机协作模式:
- 大多数员工频繁使用 Claude,但表示能“完全委托”给它的工作仅占 0-20%。
- Claude 是一个持续的合作者,但在高风险工作中,仍需人类的主动监督和验证。
2. 定性访谈 (Qualitative Interviews)
- 培养 AI 委托直觉:
- 工程师倾向于委托那些易于验证(“可以相对容易地通过嗅探测试检查正确性”)、低风险(如“一次性调试或研究代码”)或枯燥的任务。
- 许多人描述了一种信任递进过程:从简单任务开始,逐渐委托更复杂的工作。
- 技能扩展与退化:
- 扩展:
- Claude 使人们能够将技能扩展到更多领域(如后端工程师能处理前端或事务性数据库)。
- 担忧:
- 一些员工担心编写和审查代码所需的深层技能会退化—— “当产出变得如此容易和快速时,真正花时间去学习东西变得越来越难。”
- 扩展:
- 与代码工艺的关系变化:
- 一些工程师拥抱 AI 协助并专注于结果(“我以为我真的很喜欢写代码,其实我只是喜欢写代码带来的成果”);
- 另一些人则表示“肯定会怀念(写代码的)某些部分”。
- 职场社交动态:
- Claude 成了提问的第一站,减少了向同事提问的需求。一些人报告称导师指导和协作机会因此减少。
- 职业发展的不确定性:
- 工程师报告称工作重心正转向管理 AI 系统等更高层面的工作。
- 有些人对未来感到矛盾:“短期内我很乐观,但长期来看,我认为 AI 最终会做所有事情,让我和许多人变得无关紧要。”
3. Claude Code 使用趋势
- 自主性增强:
- 六年前,Claude Code 在需要人类输入前能自主完成约
10 个操作; - 现在通常能处理约 20 个,完成复杂工作流所需的人类干预频率降低。
- 六年前,Claude Code 在需要人类输入前能自主完成约
- 任务更复杂:
- 工程师越来越多地使用 Claude 处理代码设计/规划(占比从 1% 升至 10%)和实现新功能(从 14% 升至 37%)等复杂任务。
- 修复“皮肉伤”(Papercuts):
- 8.6% 的任务涉及修复那些能提高生活质量的小问题(如重构代码以提高可维护性),这些通常会被降低优先级。
- 全员“全栈”化:
- 不同团队以不同方式使用 Claude 增强核心专长。
- 例如,安全团队用它分析不熟悉的代码
- 不同团队以不同方式使用 Claude 增强核心专长。
详细数据分析
调查数据:人们用 Claude 做什么?
我们向工程师和研究人员询问了他们使用 Claude 处理各种编码任务的频率。
- 最常见的日常任务:
- 调试 (Debugging):55% 的员工每天使用。
- 代码理解 (Code Understanding):42% 的员工每天使用。
- 实现新功能:37% 的员工每天使用。
- 较少频率的任务:高层设计/规划(通常保留在人类手中)、数据科学和前端开发(总体上较少见的任务)。
使用率与生产力
- 同比激增:
- 12 个月前:在 28% 的日常工作中使用,生产力提升 +20%。
- 现在:在 59% 的工作中使用,平均生产力提升 +50%。
- 这与我们工程部门合并的 Pull Request(代码更改)数量每天每人增加 67% 的数据相吻合。
- “超级用户”:
- 在分布的极端,14% 的受访者通过使用 Claude 将生产力提高了 100% 以上。
关于生产力的说明:生产力很难精确测量。虽然有研究表明开发者可能高估 AI 带来的提升,但我们发现,那通常发生在 AI 表现不佳的复杂环境中。而我们的员工似乎已经发展出了策略性的“AI 委托技能”,避开了 AI 不擅长的领域。
时间投入与产出量
一个有趣的模式是:在几乎所有任务类别中,我们看到花费的时间净减少,而产出量有更大的净增加。
- 时间节省的差异:数据呈现两极分化。
- 一些人节省了大量时间。
- 另一些人在 AI 辅助的任务上花费了更多时间。原因包括:
- 需要更多时间调试和清理 AI 的代码(“当我把自己逼到死角时”)
- 或者因为不是自己写的代码而需要更多认知负担去理解。
- 但也有一种积极的“花费更多时间”:
- AI 帮助人们坚持完成以前可能会放弃的任务,或者进行更彻底的测试和探索。
Claude Code 使用趋势分析
我们将 Claude Code 的对话记录分类,研究了过去六个月(2025年2月至8月)的变化:
- 自主性提升:平均任务复杂度和连续工具调用次数增加,人类轮次减少。这表明人们越来越多地向 Claude 赋予自主权。
- 任务分布变化:
- 实现新功能:占比从 14.3% 激增至 36.9%。
- 代码设计或规划:从 1.0% 增至 9.9%。
- 这表明 Claude 在处理复杂任务方面变得更强了。
- 修复“皮肉伤” (Fixing Papercuts):8.6% 的任务属于此类,包括创建性能可视化工具、重构代码等。这些小修小补累积起来可能带来巨大的效率提升。
- 团队差异 (Team Variation):
- 预训练团队:主要用于构建新功能(54.6%),主要是运行额外的实验。
- 安全团队:主要用于代码理解(48.9%),分析代码库的安全性含义。
- 非技术员工:经常用于调试(51.5%)和数据科学(12.7%),Claude 帮助弥补了技术知识的差距。
展望未来 (Looking Forward)
在过去的一年里,Anthropic 员工极大地增加了对 Claude 的使用,不仅用于加速现有工作,还用于学习新代码库、减少苦差事、扩展到新领域以及处理以前被忽视的改进。
随着 AI 变得更加自主和强大,它带来了生产力的红利,但也引发了关于维持技术专长、保留有意义的协作以及为不确定的未来做准备的问题。这可能需要我们在 AI 增强的职场中采用新的学习、指导和职业发展方法。
注:本研究数据收集时(2025年8月),Claude Sonnet 4 和 Claude Opus 4 是当时最先进的模型。鉴于 AI 发展的飞速步伐,随着新模型的推出,观察到的模式可能已经发生了变化。
附录及方法论详情请参阅原文末尾。