翻译:Anthropic 内部如何通过 AI 变革工作方式

#2025/12/09

日期:2025年12月2日
原文链接: https://www.anthropic.com/research/how-ai-is-transforming-work-at-anthropic

目录

总结

  • AI 使得工程师效率显著提升(生产力+50%)
  • 工作内容向“全栈”扩展
  • 并接手了更多复杂任务(如功能开发和架构设计)。
  • 然而,这种转型也伴随着挑战:
    • 工程师们担忧核心编码技能的退化
    • 过度依赖 AI 导致的监督能力下降
    • 以及职场中人际协作(如导师制)的减少
  • Anthropic 正将自己作为“实验室”,探索适应 AI 时代的职业发展与技能培养新路径

核心摘要

AI 的使用正在从根本上改变软件开发者的工作性质,既带来了希望,也引发了担忧。

我们的研究揭示了一个正在经历重大转型的职场:

  • 效率与广度提升
    • 工程师们完成的工作量大大增加,变得更加“全栈”(能够胜任原本专业领域之外的任务),学习和迭代速度加快,并开始处理以前被忽视的任务。
  • 权衡与担忧
    • 这种工作广度的扩展也让人们思考其中的代价。
      • 一些人担心这可能导致深层技术能力的丧失,或者变得无法有效监督 Claude 的输出;
      • 而另一些人则拥抱这个机会,进行更广泛、更高维度的思考。
  • 协作模式改变:一些人发现,更多地与 AI 协作意味着与同事的协作减少;也有人担心自己最终会被自动化取代。

注:我们意识到,作为一家构建 AI 的公司, Anthropic 内部发生的事情可能是更广泛社会变革的先兆


主要发现 (Key Findings)

本节简要总结了来自调查、访谈和 Claude Code 数据的主要发现。

1. 调查数据 (Survey Data)

  • 主要用途
    • Anthropic 的工程师和研究人员最常使用 Claude 来修复代码错误了解代码库
    • 调试(Debugging)和代码理解是最常见的用途。
  • 使用率与生产力
    • 员工自述在 60% 的工作中使用 Claude。
    • 实现了 50% 的生产力提升,是去年同期的 2-3 倍。
    • 这种生产力提升表现为:
      • 每类任务花费的时间略有减少,但产出量显著增加
  • 新任务类型
    • 27% 由 Claude 辅助的工作属于“如果没有 AI 就不会做”的任务
      • 例如扩展项目规模、制作锦上添花的工具(如交互式数据仪表盘)以及手工做不划算的探索性工作。
  • 人机协作模式
    • 大多数员工频繁使用 Claude,但表示能“完全委托”给它的工作仅占 0-20%。
    • Claude 是一个持续的合作者,但在高风险工作中,仍需人类的主动监督和验证。

2. 定性访谈 (Qualitative Interviews)

  • 培养 AI 委托直觉
    • 工程师倾向于委托那些易于验证(“可以相对容易地通过嗅探测试检查正确性”)、低风险(如“一次性调试或研究代码”)或枯燥的任务。
    • 许多人描述了一种信任递进过程:从简单任务开始,逐渐委托更复杂的工作。
  • 技能扩展与退化
    • 扩展
      • Claude 使人们能够将技能扩展到更多领域(如后端工程师能处理前端或事务性数据库)。
    • 担忧
      • 一些员工担心编写和审查代码所需的深层技能会退化—— “当产出变得如此容易和快速时,真正花时间去学习东西变得越来越难。
  • 与代码工艺的关系变化
    • 一些工程师拥抱 AI 协助并专注于结果(“我以为我真的很喜欢写代码,其实我只是喜欢写代码带来的成果”);
    • 另一些人则表示“肯定会怀念(写代码的)某些部分”。
  • 职场社交动态
    • Claude 成了提问的第一站,减少了向同事提问的需求。一些人报告称导师指导和协作机会因此减少。
  • 职业发展的不确定性
    • 工程师报告称工作重心正转向管理 AI 系统等更高层面的工作。
    • 有些人对未来感到矛盾:“短期内我很乐观,但长期来看,我认为 AI 最终会做所有事情,让我和许多人变得无关紧要。”

3. Claude Code 使用趋势

  • 自主性增强
    • 六年前,Claude Code 在需要人类输入前能自主完成约 10 个操作;
    • 现在通常能处理约 20 个,完成复杂工作流所需的人类干预频率降低
  • 任务更复杂
    • 工程师越来越多地使用 Claude 处理代码设计/规划(占比从 1% 升至 10%)和实现新功能(从 14% 升至 37%)等复杂任务。
  • 修复“皮肉伤”(Papercuts)
    • 8.6% 的任务涉及修复那些能提高生活质量的小问题(如重构代码以提高可维护性),这些通常会被降低优先级。
  • 全员“全栈”化
    • 不同团队以不同方式使用 Claude 增强核心专长。
      • 例如,安全团队用它分析不熟悉的代码

详细数据分析

调查数据:人们用 Claude 做什么?

我们向工程师和研究人员询问了他们使用 Claude 处理各种编码任务的频率。

  • 最常见的日常任务
    • 调试 (Debugging):55% 的员工每天使用。
    • 代码理解 (Code Understanding):42% 的员工每天使用。
    • 实现新功能:37% 的员工每天使用。
  • 较少频率的任务:高层设计/规划(通常保留在人类手中)、数据科学和前端开发(总体上较少见的任务)。

使用率与生产力

  • 同比激增
    • 12 个月前:在 28% 的日常工作中使用,生产力提升 +20%。
    • 现在:在 59% 的工作中使用,平均生产力提升 +50%
  • 这与我们工程部门合并的 Pull Request(代码更改)数量每天每人增加 67% 的数据相吻合。
  • “超级用户”
    • 在分布的极端,14% 的受访者通过使用 Claude 将生产力提高了 100% 以上

关于生产力的说明:生产力很难精确测量。虽然有研究表明开发者可能高估 AI 带来的提升,但我们发现,那通常发生在 AI 表现不佳的复杂环境中。而我们的员工似乎已经发展出了策略性的“AI 委托技能”,避开了 AI 不擅长的领域

时间投入与产出量

一个有趣的模式是:在几乎所有任务类别中,我们看到花费的时间净减少,而产出量有更大的净增加

  • 时间节省的差异:数据呈现两极分化。
    • 一些人节省了大量时间。
    • 另一些人在 AI 辅助的任务上花费了更多时间。原因包括:
      • 需要更多时间调试和清理 AI 的代码(“当我把自己逼到死角时”)
      • 或者因为不是自己写的代码而需要更多认知负担去理解。
    • 但也有一种积极的“花费更多时间”:
      • AI 帮助人们坚持完成以前可能会放弃的任务,或者进行更彻底的测试和探索。

Claude Code 使用趋势分析

我们将 Claude Code 的对话记录分类,研究了过去六个月(2025年2月至8月)的变化:

  1. 自主性提升:平均任务复杂度和连续工具调用次数增加,人类轮次减少。这表明人们越来越多地向 Claude 赋予自主权。
  2. 任务分布变化
    • 实现新功能:占比从 14.3% 激增至 36.9%
    • 代码设计或规划:从 1.0% 增至 9.9%
    • 这表明 Claude 在处理复杂任务方面变得更强了。
  3. 修复“皮肉伤” (Fixing Papercuts):8.6% 的任务属于此类,包括创建性能可视化工具、重构代码等。这些小修小补累积起来可能带来巨大的效率提升。
  4. 团队差异 (Team Variation)
    • 预训练团队:主要用于构建新功能(54.6%),主要是运行额外的实验。
    • 安全团队:主要用于代码理解(48.9%),分析代码库的安全性含义。
    • 非技术员工:经常用于调试(51.5%)和数据科学(12.7%),Claude 帮助弥补了技术知识的差距。

展望未来 (Looking Forward)

在过去的一年里,Anthropic 员工极大地增加了对 Claude 的使用,不仅用于加速现有工作,还用于学习新代码库、减少苦差事、扩展到新领域以及处理以前被忽视的改进。

随着 AI 变得更加自主和强大,它带来了生产力的红利,但也引发了关于维持技术专长保留有意义的协作以及为不确定的未来做准备的问题。这可能需要我们在 AI 增强的职场中采用新的学习、指导和职业发展方法。

注:本研究数据收集时(2025年8月),Claude Sonnet 4 和 Claude Opus 4 是当时最先进的模型。鉴于 AI 发展的飞速步伐,随着新模型的推出,观察到的模式可能已经发生了变化。


附录及方法论详情请参阅原文末尾。