翻译：Anthropic 内部如何通过 AI 变革工作方式

#2025/12/09

日期：2025年12月2日
原文链接： https://www.anthropic.com/research/how-ai-is-transforming-work-at-anthropic

总结

AI 使得工程师效率显著提升（生产力+50%）
工作内容向“全栈”扩展
并接手了更多复杂任务（如功能开发和架构设计）。
然而，这种转型也伴随着挑战：
- 工程师们担忧核心编码技能的退化
- 过度依赖 AI 导致的监督能力下降
- 以及职场中人际协作（如导师制）的减少
Anthropic 正将自己作为“实验室”，探索适应 AI 时代的职业发展与技能培养新路径

核心摘要

AI 的使用正在从根本上改变软件开发者的工作性质，既带来了希望，也引发了担忧。

我们的研究揭示了一个正在经历重大转型的职场：

效率与广度提升：
- 工程师们完成的工作量大大增加，变得更加“全栈”（能够胜任原本专业领域之外的任务），学习和迭代速度加快，并开始处理以前被忽视的任务。
权衡与担忧：
- 这种工作广度的扩展也让人们思考其中的代价。
  - 一些人担心这可能导致深层技术能力的丧失，或者变得无法有效监督 Claude 的输出；
  - 而另一些人则拥抱这个机会，进行更广泛、更高维度的思考。
协作模式改变：一些人发现，更多地与 AI 协作意味着与同事的协作减少；也有人担心自己最终会被自动化取代。

注：我们意识到，作为一家构建 AI 的公司， Anthropic 内部发生的事情可能是更广泛社会变革的先兆

主要发现 (Key Findings)

本节简要总结了来自调查、访谈和 Claude Code 数据的主要发现。

1. 调查数据 (Survey Data)

主要用途：
- Anthropic 的工程师和研究人员最常使用 Claude 来修复代码错误和了解代码库。
- 调试（Debugging）和代码理解是最常见的用途。
使用率与生产力：
- 员工自述在 60% 的工作中使用 Claude。
- 实现了 50% 的生产力提升，是去年同期的 2-3 倍。
- 这种生产力提升表现为：
  - 每类任务花费的时间略有减少，但产出量显著增加。
新任务类型：
- 27% 由 Claude 辅助的工作属于“如果没有 AI 就不会做”的任务
  - 例如扩展项目规模、制作锦上添花的工具（如交互式数据仪表盘）以及手工做不划算的探索性工作。
人机协作模式：
- 大多数员工频繁使用 Claude，但表示能“完全委托”给它的工作仅占 0-20%。
- Claude 是一个持续的合作者，但在高风险工作中，仍需人类的主动监督和验证。

2. 定性访谈 (Qualitative Interviews)

培养 AI 委托直觉：
- 工程师倾向于委托那些易于验证（“可以相对容易地通过嗅探测试检查正确性”）、低风险（如“一次性调试或研究代码”）或枯燥的任务。
- 许多人描述了一种信任递进过程：从简单任务开始，逐渐委托更复杂的工作。
技能扩展与退化：
- 扩展：
  - Claude 使人们能够将技能扩展到更多领域（如后端工程师能处理前端或事务性数据库）。
- 担忧：
  - 一些员工担心编写和审查代码所需的深层技能会退化—— “当产出变得如此容易和快速时，真正花时间去学习东西变得越来越难。”
与代码工艺的关系变化：
- 一些工程师拥抱 AI 协助并专注于结果（“我以为我真的很喜欢写代码，其实我只是喜欢写代码带来的成果”）；
- 另一些人则表示“肯定会怀念（写代码的）某些部分”。
职场社交动态：
- Claude 成了提问的第一站，减少了向同事提问的需求。一些人报告称导师指导和协作机会因此减少。
职业发展的不确定性：
- 工程师报告称工作重心正转向管理 AI 系统等更高层面的工作。
- 有些人对未来感到矛盾：“短期内我很乐观，但长期来看，我认为 AI 最终会做所有事情，让我和许多人变得无关紧要。”

3. Claude Code 使用趋势

自主性增强：
- 六年前，Claude Code 在需要人类输入前能自主完成约 10 个操作；
- 现在通常能处理约 20 个，完成复杂工作流所需的人类干预频率降低。
任务更复杂：
- 工程师越来越多地使用 Claude 处理代码设计/规划（占比从 1% 升至 10%）和实现新功能（从 14% 升至 37%）等复杂任务。
修复“皮肉伤”（Papercuts）：
- 8.6% 的任务涉及修复那些能提高生活质量的小问题（如重构代码以提高可维护性），这些通常会被降低优先级。
全员“全栈”化：
- 不同团队以不同方式使用 Claude 增强核心专长。
  - 例如，安全团队用它分析不熟悉的代码

详细数据分析

调查数据：人们用 Claude 做什么？

我们向工程师和研究人员询问了他们使用 Claude 处理各种编码任务的频率。

最常见的日常任务：
- 调试 (Debugging)：55% 的员工每天使用。
- 代码理解 (Code Understanding)：42% 的员工每天使用。
- 实现新功能：37% 的员工每天使用。
较少频率的任务：高层设计/规划（通常保留在人类手中）、数据科学和前端开发（总体上较少见的任务）。

使用率与生产力

同比激增：
- 12 个月前：在 28% 的日常工作中使用，生产力提升 +20%。
- 现在：在 59% 的工作中使用，平均生产力提升 +50%。
这与我们工程部门合并的 Pull Request（代码更改）数量每天每人增加 67% 的数据相吻合。
“超级用户”：
- 在分布的极端，14% 的受访者通过使用 Claude 将生产力提高了 100% 以上。

关于生产力的说明：生产力很难精确测量。虽然有研究表明开发者可能高估 AI 带来的提升，但我们发现，那通常发生在 AI 表现不佳的复杂环境中。而我们的员工似乎已经发展出了策略性的“AI 委托技能”，避开了 AI 不擅长的领域。

时间投入与产出量

一个有趣的模式是：在几乎所有任务类别中，我们看到花费的时间净减少，而产出量有更大的净增加。

时间节省的差异：数据呈现两极分化。
- 一些人节省了大量时间。
- 另一些人在 AI 辅助的任务上花费了更多时间。原因包括：
  - 需要更多时间调试和清理 AI 的代码（“当我把自己逼到死角时”）
  - 或者因为不是自己写的代码而需要更多认知负担去理解。
- 但也有一种积极的“花费更多时间”：
  - AI 帮助人们坚持完成以前可能会放弃的任务，或者进行更彻底的测试和探索。

Claude Code 使用趋势分析

我们将 Claude Code 的对话记录分类，研究了过去六个月（2025年2月至8月）的变化：

自主性提升：平均任务复杂度和连续工具调用次数增加，人类轮次减少。这表明人们越来越多地向 Claude 赋予自主权。
任务分布变化：
- 实现新功能：占比从 14.3% 激增至 36.9%。
- 代码设计或规划：从 1.0% 增至 9.9%。
- 这表明 Claude 在处理复杂任务方面变得更强了。
修复“皮肉伤” (Fixing Papercuts)：8.6% 的任务属于此类，包括创建性能可视化工具、重构代码等。这些小修小补累积起来可能带来巨大的效率提升。
团队差异 (Team Variation)：
- 预训练团队：主要用于构建新功能（54.6%），主要是运行额外的实验。
- 安全团队：主要用于代码理解（48.9%），分析代码库的安全性含义。
- 非技术员工：经常用于调试（51.5%）和数据科学（12.7%），Claude 帮助弥补了技术知识的差距。

展望未来 (Looking Forward)

在过去的一年里，Anthropic 员工极大地增加了对 Claude 的使用，不仅用于加速现有工作，还用于学习新代码库、减少苦差事、扩展到新领域以及处理以前被忽视的改进。

随着 AI 变得更加自主和强大，它带来了生产力的红利，但也引发了关于维持技术专长、保留有意义的协作以及为不确定的未来做准备的问题。这可能需要我们在 AI 增强的职场中采用新的学习、指导和职业发展方法。

注：本研究数据收集时（2025年8月），Claude Sonnet 4 和 Claude Opus 4 是当时最先进的模型。鉴于 AI 发展的飞速步伐，随着新模型的推出，观察到的模式可能已经发生了变化。

附录及方法论详情请参阅原文末尾。

liguwe's site