摘要

1) 一句话总结 Anthropic 最新经济指数报告揭示了 AI 采用在地理分布与企业应用中的显著不均衡性,指出高收入地区和特定专业任务(如编程)占据主导,且企业端更倾向于将 AI 用于任务自动化而非人机协作。

2) 核心要点

  • 采用率快速增长:美国员工在工作中使用 AI 的比例已达 40%,较两年前的 20% 翻倍,采用速度远超个人电脑和互联网等历史技术。
  • 使用场景演变:在 Claude.ai 上,编程任务仍占主导(36%),但教育(从 9.3% 增至 12.4%)和科学(从 6.3% 增至 7.2%)等知识密集型任务的份额正在快速上升。
  • 用户赋予 AI 更多自主权:Claude.ai 上的“指令型”(即完全委托任务)对话比例从 27% 跃升至 39%,这是自动化使用模式首次超过增强型(协作)使用模式。
  • 全球采用与收入高度相关:基于适龄劳动人口调整的 AI 使用指数(AUI)显示,以色列(预期使用量的 7 倍)和新加坡(4.57 倍)等高收入国家人均使用量领先,而印度(0.27 倍)和尼日利亚(0.2 倍)等新兴经济体采用率较低。
  • 美国本土采用受地方经济驱动:华盛顿特区(3.82 倍)和犹他州(3.78 倍)的人均使用量领先于加利福尼亚州(2.13 倍),且各州使用模式反映了当地产业特征(如加州偏 IT,佛州偏金融,华盛顿特区偏文档编辑)。
  • 采用成熟度影响使用方式:高采用率国家的使用场景更多样化且倾向于人机协作(增强),而低采用率国家绝大多数集中在编程任务上且更倾向于将完整任务委托给 AI(自动化)。
  • 企业 API 使用高度集中于自动化:企业通过 API 访问 Claude 主要用于编程和行政任务,其中 77% 的业务使用属于自动化模式(Claude.ai 用户仅为约 50%)。
  • 能力与价值优先于成本:在企业 API 部署中,成本较高的复杂任务往往具有更高的使用率,表明企业对价格不敏感,更看重模型能力和自动化的经济价值。
  • 数据开源:Anthropic 已开源包含任务级使用模式和地理分布的底层数据集,以支持对 AI 经济影响的独立研究。

3) 风险与缺口

  • 加剧全球经济不平等:如果 AI 的生产力收益持续集中在已经富裕的高采用率地区,可能会逆转近几十年的全球经济趋同现象,加深数字鸿沟。
  • 劳动力市场冲击与失业风险:企业端高达 77% 的自动化使用率表明,执行易被自动化任务的工人面临较高的被取代风险。
  • 企业数据基础设施成为采用瓶颈:复杂的 AI 部署需要大量的上下文信息(长输入),缺乏集中化、数字化数据基础设施的企业在有效部署 AI 时将面临严重阻碍。

正文

引言

AI 与以往技术的不同之处在于其前所未有的采用速度。仅在美国,就有 40% 的员工报告在工作中使用 AI,高于两年前(2023 年)的 20%。1 如此快速的采用反映了这项技术在广泛的应用中已经具备了极高的实用性,它能够部署在现有的数字基础设施上,并且易于使用——只需打字或说话——无需专门的培训。前沿 AI 的快速进步可能会在这些维度上进一步加速其采用。

从历史上看,新技术通常需要数十年才能被广泛采用。电力在城市电气化后花了 30 多年才普及到农户。第一台面向大众市场的个人电脑在 1981 年触及早期采用者,但直到 20 年后才进入美国的大多数家庭。即使是普及迅速的互联网,也花了大约五年时间才达到 AI 仅用两年就达到的采用率。2

为什么会这样?简而言之,新技术(即使是变革性技术)在整个经济中扩散、消费者采用在地理上的集中度降低,以及企业重组业务运营以最佳方式释放新的技术能力,都需要时间。企业采用新技术,首先是用于一小部分任务,然后是更通用的应用,这是具有重大影响的技术得以传播并产生变革性经济效应的重要途径。3

换句话说,早期技术采用的一个标志是集中性——集中在少数地理区域和企业内的少数任务上。正如我们在本报告中所记录的那样,AI 的采用在 21 世纪似乎遵循着类似的模式,尽管其时间线更短,强度也比 20 世纪的技术扩散更大。

为了研究这种早期 AI 采用的模式,我们在两个重要维度上扩展了 Anthropic 经济指数,引入了对 Claude.ai 对话的地理分析,以及对企业 API 使用情况的首次检查。我们展示了 Claude 的使用情况如何随着时间的推移而演变,不同地区的采用模式有何差异,并且——首次展示了——企业如何部署前沿 AI 来解决业务问题。

随着时间推移 Claude.ai 使用模式的变化

在本报告的第一章中,我们指出了过去八个月中 Claude.ai 使用情况的显著变化,这些变化伴随着底层模型能力的提升、新产品功能的推出以及 Claude 消费者群体的扩大。

我们发现:

  • 教育和科学使用份额正在上升:虽然使用 Claude 进行编程在我们的总样本中继续占据主导地位(36%),但教育任务从 9.3% 激增至 12.4%,科学任务从 6.3% 增至 7.2%。

  • 用户赋予 Claude 更多的自主权:“指令型”对话(即用户将完整任务委托给 Claude)从 27% 跃升至 39%。我们看到编程中的程序创建有所增加(+4.5 个百分点),而调试有所减少(-2.9 个百分点)——这表明用户可能能够在单次交互中实现更多的目标。

AI 采用的地理分布

我们首次发布了涵盖 150 多个国家和美国所有州的 Claude.ai 使用数据的地理剖析。为了研究扩散模式,我们引入了 Anthropic AI 使用指数 (AUI),以衡量一个经济体中 Claude.ai 的使用量相对于其适龄劳动人口是超额还是不足。

我们发现:

  • AUI 与各国收入密切相关:与以往的技术一样,我们看到 AI 的使用在地理上是集中的。新加坡和加拿大是人均使用量最高的国家之一,分别达到了基于其人口预期使用量的 4.6 倍和 2.9 倍。相比之下,包括印度尼西亚(0.36 倍)、印度(0.27 倍)和尼日利亚(0.2 倍)在内的新兴经济体对 Claude 的使用较少。

  • 在美国,地方经济因素塑造了使用模式:华盛顿特区(DC)的人均使用量领先(人口份额的 3.82 倍),但犹他州紧随其后(3.78 倍)。我们看到了区域使用模式反映当地经济独特特征的证据:例如,加利福尼亚州在 IT 方面的使用率较高,佛罗里达州在金融服务方面的使用率较高,而华盛顿特区在文档编辑和职业协助方面的使用率较高。

  • 领先国家的使用方式更加多样化:采用率较低的国家往往有更多的编程使用,而高采用率地区则在教育、科学和商业领域表现出多样化的应用。例如,编程任务占印度所有使用量的一半以上,而全球这一比例约为三分之一。

  • 高采用率国家表现出较少的自动化使用,而更多的是增强型使用:在控制了各国的任务组合后,低 AUI 国家更有可能委托完整的任务(自动化),而高采用率地区则倾向于更多的学习和人机迭代(增强)。

早期 AI 采用在地理上的不均衡性引发了关于经济趋同的重要问题。19 世纪末和 20 世纪初的变革性技术——广泛的电气化、内燃机、室内管道——不仅开启了现代经济增长的时代,而且伴随着世界各地生活水平的巨大分化。4

如果高采用率经济体的生产力收益更大,那么当前的使用模式表明,AI 的好处可能会集中在已经富裕的地区——这可能会加剧全球经济不平等,并逆转近几十年来出现的增长趋同现象。5

AI 的系统性企业部署

在最后一章中,我们展示了对我们很大一部分第一方 (1P) API 流量的首次洞察,揭示了公司和开发者正在使用 Claude 完成的任务。重要的是,API 用户是通过编程方式访问 Claude 的,而不是通过 Web 用户界面(如 Claude.ai)。这展示了早期采用企业如何部署前沿 AI 能力。

我们发现:

  • 第一方 (1P) API 的使用虽然与 Claude.ai 相似,但在专业化方面有所不同:1P API 的使用和 Claude.ai 的使用都高度集中在编程任务上。然而,1P API 在编程和办公/行政任务上的使用率更高,而 Claude.ai 在教育和写作任务上的使用率更高。

  • 1P API 的使用以自动化为主导:77% 的业务使用涉及自动化使用模式,而 Claude.ai 用户的这一比例约为 50%。这反映了 API 使用的编程性质。

  • 在塑造企业部署方面,能力似乎比成本更重要:在我们的 API 数据中,最常用的任务往往比不常用的任务成本更高。总体而言,我们发现了价格敏感度较弱的证据。模型能力和可行地自动化给定任务的经济价值似乎在塑造企业使用模式方面发挥了更大的作用。

  • 上下文限制了复杂的使用:我们的分析表明,为模型策划正确的上下文对于在复杂领域进行高影响力的 AI 部署至关重要。这意味着,对于一些公司来说,为了获取上下文信息而进行的昂贵的数据现代化和组织投资可能是 AI 采用的瓶颈。

开源数据以促进独立研究

与之前的报告一样,我们开源了底层数据,以支持对 AI 经济影响的独立研究。这个全面的数据集包含了 Claude.ai 和 1P API 流量的任务级使用模式(映射到 O*NET 分类法以及自下而上的类别)、按任务划分的协作模式细分,以及我们方法的详细文档。目前,地理使用模式仅适用于 Claude.ai 流量。

我们希望这些数据能帮助其他人调查的关键问题包括:

  • AI 的使用和采用对工人和企业的当地劳动力市场有什么后果?

  • 是什么决定了跨国和美国国内的 AI 采用?可以采取什么措施来确保 AI 的好处不仅归属于已经富裕的经济体?

  • 每项任务的成本在塑造企业部署模式中扮演什么角色(如果有的话)?

  • 为什么企业能够自动化某些任务而不能自动化其他任务?这对哪些类型的工人将经历更好或更差的就业前景有什么影响?

  1. Gallup 2025, AI Use at Work Has Nearly Doubled in Two Years.
  2. Bick, Blandin, Deming, 2024 The Rapid Adoption of Generative AI 将 AI 的采用与 PC 和互联网的采用进行了基准比较;Lewis & Severnini, 2020 Short- and long-run impacts of rural electrification: Evidence from the historical rollout of the U.S. power grid 分析了将电力引入农村地区对经济结果的影响。
  3. Kalyani, Bloom, Carvalho, Hassan, Lerner and Ahmed Tahoun 2025 Diffusion of New Technologies.
  4. 参见 Gordon, 2012 Is U.S. Economic Growth Over? Faltering Innovation Confronts the Six Headwinds,比较了 20 世纪早期和晚期的创新及其对生产力的影响。Pritchett, 1997. Divergence, Big Time 记录了伴随向现代经济增长时代过渡的经济分化。
  5. Kremer, Willis, You, 2022 Converging to Convergence 提供了近几十年来增长趋同的证据。参见 Jones, Jones, and Aghion, 2017 Artificial Intelligence and Economic Growth,讨论了 AI 驱动的创新自动化对增长的影响。

第 1 章:随着时间推移的 Claude.ai 使用情况

概述

了解 AI 采用如何随着时间的推移而演变,有助于预测其经济影响——从生产力提升到劳动力变化。借助涵盖 2024 年 12 月和 2025 年 1 月(来自我们的第一份报告,‘V1’)、2025 年 2 月和 3 月(‘V2’)以及我们来自 2025 年 8 月的最新洞察(‘V3’)的数据,我们可以追踪过去八个月中,随着能力和产品功能的改进、新型用户采用该技术以及使用变得更加复杂,AI 的使用情况发生了怎样的转变。我们认为下面提供的证据表明,新产品功能促成了新的工作形式,而不仅仅是加速了现有任务的采用。

Claude.ai 在经济任务中的使用情况发生了怎样的变化

虽然计算机和数学任务仍以 36% 占据整体使用量的主导地位,但我们看到知识密集型领域的持续增长。教育指导与图书馆任务从 V1 的 9% 上升到 V3 的 12%。生命、物理与社会科学任务从 6% 增加到 7%。与此同时,商业与金融运营任务的相对份额从 6% 降至 3%,管理任务从 5% 降至 3%。

这种分化表明,与传统的商业运营相比,AI 的使用可能在涉及知识综合和解释的任务中扩散得特别快——这可能是因为这些任务更多地受益于 Claude 的推理能力。

在更细粒度的层面上,我们记录了似乎与 V2 和 V3 之间推出的功能相关的任务组合变化。例如,搜索电子源和数据库大幅增长(0.03% → 0.49%),这可能反映了我们在 3 月份发布的网络搜索功能。此外,我们还看到基于互联网的研究任务有所增加(0.003% → 0.27%),这与我们在 4 月份发布的研究(Research)模式相吻合。1

我们还看到了其他类型的变化。与开发教学材料相关的任务增加了 1.3 个百分点,从 0.2% 的基数增长到 1.5%——超过 6 倍的增长,这可能反映了教育工作者中采用率的不断提高。2 创建多媒体文档增加了 0.4 个百分点,从 0.16% 几乎增加了两倍至 0.55%,这可能是由于用户持续使用我们的 Artifacts 功能在 Claude.ai 中构建传统和 AI 驱动的应用程序。

有趣的是,涉及创建新代码的任务份额增加了一倍多,增加了 4.5 个百分点(从 4.1% 增至 8.6%),而调试和纠错任务下降了 2.8 个百分点(从 16.1% 降至 13.3%)——净变化为 7.4 个百分点,倾向于创建而不是修复代码。这可能表明模型变得越来越可靠,因此用户花在修复问题上的时间更少,而花在单次交互中创建事物上的时间更多。3

与之前的报告一样,我们不仅跟踪人们使用 Claude 做什么,还跟踪他们在 Claude.ai 上如何与 Claude 协作或向其委派任务。

在宏观层面上,我们区分了使用 Claude 的自动化(automation)和增强(augmentation)模式:

自动化包含专注于任务完成的交互模式:

  • 指令型 (Directive):用户给 Claude 分配一个任务,它在最少的来回交互中完成该任务。
  • 反馈循环 (Feedback Loops):用户自动化任务,并根据需要向 Claude 提供反馈。

增强侧重于协作交互模式:

  • 学习 (Learning):用户向 Claude 询问有关各种主题的信息或解释。
  • 任务迭代 (Task Iteration):用户与 Claude 协作迭代任务。
  • 验证 (Validation):用户要求 Claude 对他们的工作提供反馈。

从 Claude.ai 对话中采样的指令型对话份额从 2024 年末 V1 的 27% 跃升至 V3 的 39%。这种增加主要是以牺牲任务迭代和学习交互为代价的,这意味着表现出自动化使用模式的对话份额出现了相当大的净增长——在短短八个月内出现了显著增长。这是第一份自动化使用超过增强使用的报告。

一种解释是,这是模型能力不断提高的结果。随着模型在预测用户需求和在首次尝试时产生高质量输出方面变得更好,用户可能需要更少的后续改进。指令型使用的激增也可能标志着人们对将完整任务委托给 AI 的信心日益增强,这是一种边干边学(learning-by-doing)的形式。4

指令型使用的增长是归因于模型能力的提高还是边干边学,可能预示着截然不同的劳动力市场影响。如果更先进的模型只是扩大了自动化任务的范围,那么执行此类任务的工人被取代的风险就会增加。然而,如果指令型使用的增加反映了边干边学,那么最能适应新的 AI 驱动工作流程的工人可能会看到更大的需求和更高的工资。换句话说,AI 可能使某些工人比其他工人受益更多:它可能导致那些最能适应技术变革的人获得更高的工资,即使那些适应能力较低的人面临工作中断。5 这将是未来研究的一个重要探究领域。

展望未来

V3 数据显示,AI 能力和采用率正在继续取得进展。基于知识的任务,包括教育和科学应用,继续保持快速增长率,新产品功能似乎正在促成不同类型的工作,而不仅仅是加速现有任务。

最引人注目的是,数据指向了越来越多地将任务委托给 AI 系统——这可能是由于用户对技术的信任以及底层模型能力的提高相结合。这也可能是由于底层用户群的变化。本报告的下一章首次按地理位置细分了使用情况,使我们能够在未来更清晰地解开时间与地理变化的纠葛。我们将在未来的报告中继续密切跟踪这些趋势。

  1. “搜索电子源(如数据库或存储库)或手动源以获取信息”从 0.03% 增加到 0.49%。“进行基于互联网和图书馆的研究”从 0.003% 增加到 0.27%。
  2. 根据包含字符串“开发教学材料”的任务计算得出的统计数据。
  3. 任务是从频率变化幅度大于或等于 0.2 个百分点的任务集中整理出来的。编程创建任务包括:“编写新程序或修改现有程序”(1.5% → 4.9%)、“设计、构建或维护网站”(1.2% → 2.0%)、“编写、分析、审查和重写程序”(1.2% → 0.5%)、“开发新的软件应用程序”(0.06% → 0.6%)、“开发事务性 Web 应用程序”(0.1% → 0.3%)和“开发特定于应用程序的软件”(0.05% → 0.3%)。调试/纠错任务包括:“修改现有软件以纠正错误”(两个变体:2.5% → 3.8% 和 4.8% → 2.7%)、“通过进行适当的更改来纠正错误”(3.0% → 2.1%)、“执行初始调试程序”(2.0% → 0.9%)、“诊断、排除和解决硬件/软件问题”(1.6% → 2.5%)、“审查和分析计算机打印输出以定位代码问题”(1.3% → 0.9%)和“确定网页或服务器问题的来源”(0.9% → 0.4%)。
  4. 我们注意到 V3 使用 Claude Sonnet 4 进行分类,而 V2 使用 Sonnet 3.7,这使得直接比较变得复杂。为了解决这个问题,我们使用 Sonnet 3.7 重新运行了 V3 数据,仍然发现指令型交互显著上升(尽管绝对水平较低,为 45% 的自动化,而 Sonnet 4 为 49%)。我们还验证了这种趋势不是由任务组合的变化驱动的——向指令型交互的转变出现在广泛的职业类别中,这表明它反映了人们与 Claude 交互方式的真正变化,而不是构成效应。
  5. Nelson and Phelps, 1966 Investment in Humans, Technological Diffusion, and Economic Growth 是关于教育在使工人具备适应变化能力方面的价值的经典参考文献。另见 Goldin and Katz, 2008 The Race between Education and Technology。我们感谢 Anton Korinek 的观察,即 AI 本身可能会加速 AI 的扩散和经济影响,只要它扮演了过去熟练工人在弄清楚如何在新的环境中有效运用新技术时所扮演的角色。

第 2 章:Claude 在美国及全球的使用情况

概述

AI 首先在哪里被采用——以及它是如何被使用的——将塑造全球的经济结果。通过分析涵盖 150 多个国家和美国所有州的 Claude 使用模式,我们揭示了三个关键动态:早期采用者在哪里,他们使用 AI 做什么,以及使用情况如何随着采用的成熟而演变。这些地理模式提供了关于 AI 经济扩散的真实世界证据,有助于跟踪不同地区在 AI 采用方面是趋同还是分化,并揭示了地方经济特征如何塑造技术部署。

我们的数据依赖于对 100 万次 Claude.ai 对话 2 进行的保护隐私 1 的分析,证实了我们的一些预期,同时也挑战了其他预期。美国在总使用量中占据主导地位,达到 21.6%,考虑到其规模和高收入,这并不奇怪。但即使在调整了适龄劳动人口规模后,高收入国家往往也有更高的使用率。例如,新加坡的使用率是其适龄劳动人口预期使用率的 4.5 倍,而全球大片地区的使用率极低。有趣的是,在美国国内,华盛顿特区和犹他州的人均使用量超过了加利福尼亚州。

我们还观察到,随着人均采用率的加深,AI 用例也会发生变化。人均 AI 采用率较低的国家绝大多数集中在编程任务上——在印度占所有使用量的一半以上,而全球这一比例约为三分之一。随着采用的成熟,使用变得多样化,对教育、科学和商业运营的重视程度不断提高。

更引人注目的是:成熟市场倾向于更协作地使用 AI,而新兴市场更有可能将完整的任务委托给它——这可能反映了处于不同结构性转型阶段的经济体在部署 AI 方式上的差异。我们的数据为了解跨地域的这些模式提供了一个窗口,并且在未来,将使我们能够跟踪这些采用差距是缩小、扩大还是在结构上随时间发生变化。

Claude 在全球的扩散

总体而言,Claude 的采用在地理上高度集中。在总的全球使用量方面,美国占最高份额(21.6%),其次使用量最高的国家份额明显较低(印度为 7.2%,巴西为 3.7%,见图 2.1)。然而,这种集中度受到每个国家人口规模的影响 3——较大的国家可能仅仅因为其人口规模而拥有较大的使用份额。

为了解释人口规模的差异,我们分析了根据适龄劳动人口调整后的使用情况,引入了一项名为 Anthropic AI 使用指数 (AUI) 的新指标:对于每个地理区域,我们计算其 Claude 使用份额,以及其适龄劳动人口(15-64 岁)份额。然后我们将这些份额相除来计算 AUI:

该指数揭示了各国相对于其适龄劳动人口对 Claude 的使用是超出预期还是低于预期。AUI > 1 的地区在调整人口后使用量高于预期,而 AUI < 1 的地区使用量较低。

结果揭示了在小型、技术先进的经济体中惊人的集中模式。以色列以 7 的 Anthropic AI 使用指数领跑全球人均 Claude 使用量——这意味着其适龄劳动人口对 Claude 的使用量是基于其人口预期使用量的 7 倍。新加坡紧随其后,为 4.57,而澳大利亚(4.10)、新西兰(4.05)和韩国(3.73)跻身人均 Claude 使用量前五名。

接下来,我们根据 AUI 创建人均使用层级。我们查看在我们 100 万次对话的随机样本中至少有 200 次对话的国家,并为不同的使用层级设置阈值(基于四分位数),即领先(前 25%)、中上(50-75%)、中下(25%-75%)和新兴(后 25%)。然后,即使某些国家的观察结果少于 200 个,我们也会根据其 AUI 将其分配到一个层级。对于我们有其人口数据但在样本中没有使用记录的国家,我们将其分配到“极少 (Minimal)”层级。4 图 2.3 说明了全球的 Anthropic AI 使用指数层级,表 2.1 显示了层级和国家示例的概述。

深入探讨人均使用量领先和新兴的国家

这种集中在人口规模有限的发达经济体中的现象,反映了它们作为技术先驱的既定模式。例如,以色列和新加坡在全球创新指数(衡量全球不同经济体创新程度的指标)中都名列前茅,这表明对信息技术的总体投资使经济体能够很好地快速采用前沿 AI。总体而言,这些经济体可以利用其受过良好教育的劳动力、强大的数字基础设施和有利于创新的政策,为 AI 创造肥沃的条件。

值得注意的是主要发达经济体在 Claude 使用方面的地位。美国(3.62)在人均采用率方面跻身领先国家之列,加拿大(2.91)和英国(2.67)相对于其人口而言,采用率较高但更为温和。其他主要经济体的采用率较低,包括法国(1.94)、日本(1.86)和德国(1.84)。

与此同时,许多中低收入经济体对 Claude 的使用极少,非洲、拉丁美洲和亚洲部分地区的许多国家对 Claude 的采用率低于基于其适龄劳动人口的预期。这包括玻利维亚(0.48)、印度尼西亚(0.36)、印度(0.27)和尼日利亚(0.2)。

这种使用上的差异反映了这些经济体之间的收入差异。我们看到 Claude 的采用与适龄劳动人口的人均国内生产总值(GDP)之间存在很强的正相关关系(见图 2.4),人均 GDP 每增加 1%,人均 Claude 使用量就会增加 0.7%。

Claude 使用上的差异可能反映了多种因素的交汇,其中一些因素与收入相关:

  • 数字基础设施:高使用率国家通常拥有访问 AI 助手所需的强大互联网连接和云计算访问权限。
  • 经济结构:正如本报告和之前的报告所记录的那样,Claude 的能力非常适合知识工作者的各种典型任务。与制造业就业份额较大的低收入经济体相比,发达经济体往往有更大比例的劳动力从事此类角色。
  • 监管环境:各国政府在积极鼓励不同行业使用 AI 以及对该技术进行严格监管的程度上有所不同。
  • 意识和访问权限:与硅谷和 AI 研究社区联系更紧密的国家可能对 Claude 有更高的认识和访问权限。
  • 信任和舒适度:公众对 AI 信任度的看法在不同国家之间存在很大差异。

Claude 在美国的扩散

在美国国内,加利福尼亚州以 25.3% 的使用量占据压倒性优势。其他拥有主要科技中心的州,如纽约州(9.3%)、得克萨斯州(6.7%)和弗吉尼亚州(4.0%)也排名靠前。虽然没有根据人口进行调整,但我们怀疑这些强劲的采用数据部分反映了科技中心的快速采用——这与历史上具有经济影响力的技术往往如何扩散相一致。

然而,当我们根据每个州的人口规模进行调整时,情况变得更加复杂。令人惊讶的是,华盛顿特区以 3.82 的 Anthropic AI 使用指数领先,这表明华盛顿特区的 Claude 使用量是其占全国适龄劳动人口份额的 3.82 倍。紧随其后的是犹他州(3.78),明显领先于加利福尼亚州(2.13)、纽约州(1.58)和弗吉尼亚州(1.57)。7

我们记录了美国各州 Claude 采用率与人均收入之间存在类似但弱于全球水平的相关性。收入差异解释了跨州采用率差异的不到一半。尽管相关性较弱,但我们发现 Claude 的采用率随着收入的增加而增长得更快:州人均 GDP 每增加 1%,AI 使用指数就会增加 1.8%。

各国的任务使用模式

我们观察到不同国家在使用 Claude 的方式上存在显著差异。与过去的报告一样,我们使用两种不同的方法来分析这些趋势。首先,我们根据 O*NET(一种将特定任务映射到职业和职业组的美国分类法,例如,涉及软件调试的任务将归入计算机和数学职业组)将对话分类为任务。

其次,我们使用 Claude 构建了一个自下而上的 Claude.ai 用户请求分类法,这提供了对无法整齐地归入现有分类法的使用模式的洞察。例如,请求集群“帮助撰写和改进求职申请的求职信”(最低层级)汇入更高层级的集群“帮助处理求职申请、简历和职业文件”(中间层级),后者又汇入集群“帮助处理求职申请、简历和职业发展”(最高层级)。这两种互补的方法使我们既能报告与标准劳工统计数据一致的结果,又能提供灵活性以捕获标准分类法遗漏的任务。

当分析在最高层级(就它们所属的标准职业分类职业组而言)聚合的 O*NET 任务时,我们注意到各国之间存在强烈的差异。虽然整体模式存在噪音——特别是对于观察结果较少的国家——但图 2.7 表明,随着我们从较低的人均 Claude 采用率向较高的采用率过渡,使用情况从计算机和数学职业组中的任务(例如编程)转移到教育、办公和行政用途以及艺术等领域更多样化的任务。我们还看到生命、物理和社会科学领域的使用量增加。

在查看我们自下而上的请求分类法时,也会出现国家的特质。8 以美国、巴西、越南和印度为例,它们代表了在给定的 Anthropic AI 使用指数层级内总使用量最高的国家。与全球平均水平相比,美国用户在家庭管理目的、寻找工作和医疗指导方面不成比例地使用 Claude。相比之下,巴西的 Claude 用户在翻译和法律服务方面的使用率相对较高。越南最不成比例的请求与软件开发和教育有关,而印度最不成比例的请求几乎完全集中在软件开发上。这可能反映了当地的专业化:巴西一直是司法系统中 AI 的早期采用者,而印度拥有庞大的信息技术部门。

在所有国家中,软件开发成为 Claude 最常见的用途。为什么开发者任务在整体 Claude 使用模式中始终处于领先地位?有几个因素可能促成了这种效应:

  • 模型-任务契合度:Claude 是一个非常强大的编程模型,很容易部署在代码生成、调试和技术问题解决任务中。
  • 开发者的接受度:开发者社区迅速接受新工具,并且这种使用通过他们的社交和专业网络扩散。
  • 较低的组织障碍:个人开发者通常可以采用 Claude 而无需复杂的审批流程——这与医疗用例等形成鲜明对比。

美国的任务使用模式

在本节中,我们探讨了美国各州 Claude 的使用模式,让我们进一步了解当地经济条件如何塑造使用模式。正如我们在上文所讨论的,Anthropic AI 使用指数的跨州差异解释了美国各州收入差异的不到一半。这表明其他区域差异——包括 Claude 的能力与当地劳动力职业构成的兼容性——在决定为什么使用更集中在某些州而不是其他州方面发挥了更大的作用。

在许多州,我们看到了当地 AI 使用模式与当地经济独特特征相一致的证据。当分析每个使用层级中排名靠前的州——领先的加利福尼亚州、中上的得克萨斯州、中下的佛罗里达州和新兴的南卡罗来纳州——我们在自下而上的请求分类法方面看到了强烈的差异(见图 2.9)。

例如,加利福尼亚州在 IT 相关请求、数字营销和翻译方面表现出不成比例的使用,这可能反映了其科技行业和语言多样化的人口。加利福尼亚州在基本数字任务方面的请求也不成比例地频繁,这可能代表了对模型能力的测试或滥用。佛罗里达州在商业建议和健身方面的使用不成比例,这可能与其作为税率相对较低的金融中心以及适合户外活动的温暖气候的作用有关。

在美国国内,华盛顿特区在人均 Claude 使用量方面处于领先地位,在 O*NET 任务分类和自下而上的分类中,不成比例地集中在文档编辑、信息提供和求职申请上(见图 2.10)。例如,在华盛顿特区,求职申请的帮助是美国整体水平的 1.84 倍。我们的交互式仪表板允许每个人探索美国各州的全部差异和模式。

人机协作的地理模式

虽然前面的部分研究了人们使用 Claude 执行哪些任务,但在他们如何与 Claude 交互方面也出现了一个同样具有启发性的模式。在这里,我们使用与第 1 章中定义的相同的增强和自动化协作模式。

各国拥有不同的任务组合,这意味着它们专注于不同的经济任务,这可能部分解释了自动化模式的差异。在本节中,我们调查了在人均采用率低和高的经济体中,自动化使用是否存在系统性差异——即使在控制了任务组合差异的情况下。9

我们发现,即使在控制了一个国家的任务组合时,来自不同国家的用户在自主委托与协作交互方面也表现出明显不同的偏好。随着人均 Claude 使用量的增加,各国从以自动化为中心的使用转向以增强为中心的使用。这有些违反直觉,因为我们正在控制不同国家之间更多样化的任务构成。我们推测,文化和经济因素可能会影响自动化份额,或者每个国家的早期采用者倾向于以更自动化的方式使用 AI——但这里需要更多的研究。

结论

我们对跨地域 Claude 使用模式的分析揭示了几个关键见解。最引人注目的之一是 Claude 使用的地理集中度。美国和加利福尼亚州在整体 Claude 使用方面的领先地位,以及 Claude 使用与人均收入的强相关性,表明这与过去的技术有相似之处,在过去的技术中,最初的地理集中和专业化使用是一个关键特征。与先前技术的扩散模式进行类比,可能有助于我们更好地理解 AI 的扩散和影响。

令人惊讶的是,地理位置不仅塑造了 AI 工具的用途,还塑造了它们的使用方式。人均使用量相对较低的经济体中的用户相对偏好将任务委托给 Claude(自动化),而人均使用量较高的经济体中的用户在某种程度上更有可能偏好与 Claude 进行更具协作性或基于学习的交互(增强),即使在控制了任务组合的情况下也是如此。与任务使用的本地专业化类似,AI 协作模式的本地专业化表明,AI 的影响在不同地区可能会有很大差异。

AI 采用的地理模式——在哪里使用、用于哪些任务以及如何使用——表明,为了实现 AI 造福全球人民的潜力,政策制定者需要关注 AI 使用和采用的局部集中,并应对数字鸿沟加深的风险。

  1. 出于隐私原因,我们的自动分析系统会过滤掉任何少于 15 次对话和 5 个唯一用户帐户的单元格——例如,国家和(国家,任务)交叉点。对于自下而上的请求集群,我们有更高的隐私过滤器,至少需要 500 次对话和 250 个唯一帐户。
  2. 本节中的数据涵盖了 2025 年 8 月 4 日至 11 日期间的 100 万次 Claude.ai 免费和 Pro 对话,这些对话是从该期间未被标记为潜在信任和安全违规的所有对话中随机抽样的。观察单位是在 Claude.ai 上与 Claude 的对话,而不是用户,因此有可能包含来自同一用户的多次对话,尽管我们过去的工作表明,随机抽样对话与按用户分层抽样不会产生实质性不同的结果。国家和美国州级别的汇总地理统计数据是根据每次对话的 IP 地址进行评估和制表的。对于地理定位,我们使用 ISO-3166 代码,因为我们的 IP 地理定位提供商使用此标准。国际位置使用 ISO-3166-1 国家代码,美国州级数据使用 ISO-3166-2 区域代码,其中包括所有 50 个美国州和华盛顿特区。我们排除了源自 VPN、任播或托管服务的对话,这由我们的 IP 地理定位提供商确定。
  3. 国际位置使用 ISO-3166-1 国家代码,其中包括国家和一些地区。
  4. 层级阈值(四分位数)基于在全球层面至少有 200 个观察结果的国家,以及在美国层面至少有 100 个观察结果的美国州。没有观察到使用情况的国家被分配到“极少 (Minimal)”层级,因为我们不知道它们的使用量是完全为零,还是我们的随机样本没有捕获到少量使用。未来的工作,例如使用分层抽样,将使我们能够在较小国家和州的观察结果有限的情况下,以更高的准确性探索这些模式。
  5. 世界地图基于 Natural Earth 的世界地图,采用 ISO 标准的争议领土视角,这意味着该地图可能不包含某些争议领土。我们注意到,除了以灰色显示的国家(“Claude 不可用”)之外,我们不在乌克兰的克里米亚、顿涅茨克、赫尔松、卢甘斯克和扎波罗热地区运营。根据国际制裁和我们对支持乌克兰领土完整的承诺,我们的服务在俄罗斯占领区不可用。
  6. “无数据”适用于部分数据缺失的国家。一些地区(例如,西撒哈拉、法属圭亚那)拥有自己的 ISO-3611 代码。其中一些有一些使用量,另一些则没有。由于 Anthropic AI 使用指数是根据世界银行的适龄劳动人口数据按适龄劳动人口人均计算的,并且并非所有这些地区都容易获得人口数据,因此我们无法计算这些地区的 AUI。
  7. 在进一步调查犹他州的活动时,我们发现其很大一部分使用情况似乎可能与协同滥用有关。这也反映在远高于平均水平的“指令型”自动化得分上。然而,我们进行了稳健性检查,并认为这项活动并没有驱动结果。
  8. 请求被过滤为代表全球层面至少 1% 的请求和本地层面 1% 的请求。
  9. 为了隔离自动化偏好与 Claude 使用之间的关系,并考虑到任务构成的差异,我们执行以下操作:首先,我们通过采用加权平均值来计算每个国家的预期自动化百分比。对于每个 O*NET 任务(例如,编程、写作或分析),我们将该任务在该国使用量中的份额乘以该任务类型的全球自动化率(Claude 在全球范围内通过指令/反馈循环模式完成该任务的百分比)。将这些相加,我们就得到了给定该国特定任务组合的每个国家自动化百分比的预期值。然后,我们将实际自动化百分比和 AUI 对这个预期自动化百分比进行回归。这些回归的残差代表了每个变量中无法由任务构成解释的变异。通过检查这些残差之间的关系(称为偏回归分析),我们可以确定那些 AI 使用量高于其任务组合预测值的国家,是否也倾向于具有高于预测值的自动化程度。

第 3 章:Claude 的 API 企业部署

概述

前沿 AI 能力是否能让我们提高生产力、重塑劳动力市场并加速增长,将取决于企业选择何时以及如何部署 AI。即使企业认识到 AI 的潜力,有利可图地采用它也可能需要对生产流程进行昂贵的重组、培训新工人,以及进行其他沉没成本投资以促进有效部署。1

为了了解企业对 AI 的采用模式,我们转向了一个新的数据源:Anthropic 的第一方 (1P) API 客户——同样依赖于保护隐私的方法。2 我们的 API 允许客户将 Claude 直接集成到他们自己的产品和应用程序中,并按使用的 Token 收费,而不是收取固定的订阅费。这代表了一种与我们在前两章中重点关注的 Claude.ai 根本不同的产品体验。

制度惯性加上采用的固定成本表明,企业使用 AI 的早期例子可能会集中在部署容易、能力强大且采用带来的经济效益高的专业任务中。

事实上,我们在本章提供的数据中看到了符合这些思路的证据。我们的分析揭示了几个模式:

  • 企业以相似但更专业的方式使用 Claude:企业将使用集中在 AI 部署非常适合编程访问的任务上,如编程或行政任务。与 Claude.ai 用户相比,企业较少将 Claude 用于教育或创意任务,并且总体上以更自动化的方式使用。
  • API 客户倾向于偏好成本更高的任务:尽管任务的成本差异巨大,但最昂贵的任务往往具有更高的使用率,这表明模型能力、部署的便利性以及自动化的经济价值在决定采用方面远比交互本身的成本重要得多。
  • 复杂的部署需要访问适当的上下文信息:我们发现了 AI 对企业有用性的一个重要潜在瓶颈的证据。将 Claude 用于复杂任务的 API 客户倾向于向 Claude 提供冗长的输入。对于一些依赖于尚未集中或数字化的分散上下文的重要任务来说,这可能构成更广泛企业部署的障碍。纠正这一瓶颈可能需要企业重组其组织、投资新的数据基础设施,并集中信息以实现有效的模型部署。

背景设定:公开数据中的 AI 采用模式

在深入研究我们的 API 数据之前,有必要先了解一下企业 AI 采用的更广泛背景。根据美国人口普查局的商业趋势和展望调查,美国企业中 AI 的采用率在过去两年中增加了一倍多,从 2023 年秋季的 3.7% 上升到 2025 年 8 月初的 9.7%(图 3.1)。3 尽管增长率如此之快,但美国绝大多数企业并未报告在其生产流程中使用 AI。

但这些总体数字掩盖了各行业之间的巨大差异。例如,在 2025 年 8 月初,信息行业中四分之一的企业报告使用了 AI,这大约是住宿和餐饮服务业的十倍。4

这些公开数据描绘的图景很清晰:企业对 AI 的使用正在快速增长,但我们仍处于 AI 采用的早期阶段。使用情况在整个经济中的分布仍然不均衡,最能够快速采用并从这项技术中受益的行业正在这样做。

正如我们在下面将看到的,我们的 1P API 数据得出了一个互补的结论:Claude 的早期企业使用同样在整个经济中分布不均,并且主要部署在信息行业职业的典型任务中。

Anthropic API 客户的专业化使用

为了分析 API 流量,我们应用了与前几章相同的保护隐私的分类方法——将匿名化的 API 记录按 O*NET 任务和自下而上的分类法进行分类。出现的模式表明,企业使用集中在特别适合自动化的专业任务中。

总体而言,软件开发占据了主导地位。在前 15 个用例集群中——约占所有 API 流量的一半——大多数与编程和开发任务有关。调试 Web 应用程序和解决技术问题各占使用量的约 6%,而构建专业的商业软件则占了另一个重要部分。值得注意的是,大约 5% 的 API 流量专门集中在开发和评估 AI 系统本身(图 3.2)。

但并非所有的 API 使用都是为了编程。API 客户还部署 Claude 来创建营销材料(4.7%)以及处理业务和招聘数据(1.9%)。这两个类别表明,AI 不仅被部署用于直接生产商品和服务,还用于人才获取和外部沟通。

O*NET 分类使这些模式更加清晰。略少于一半的 API 流量映射到计算机和数学任务——比 Claude.ai 的使用率高出 8 个百分点以上。办公和行政任务以大约 10% 的记录位居第二,反映了它们对自动化的适用性。

另一方面,在 Claude.ai 上突出的几个交互繁重的任务在 API 使用中的份额要小得多:教育和图书馆任务从 12.3% 降至 3.6%,而艺术和娱乐任务从 8.2% 降至 5.2%。

然而,在许多情况下,Claude.ai 和 API 数据之间的职业类别相当接近,这表明在许多情况下,推动采用的是底层模型能力,而不是特定的产品表面。

职业细分与任务专业化

尽管通过不同的界面服务于不同的用户,但 API 和 Claude.ai 的使用在各项任务中遵循着非常相似的幂律分布。在 Claude.ai 对话中,底层 80% 的任务类别仅占使用量的 12.7%;对于 API 客户来说,它稍微更集中一些,为 10.5%(图 3.4)。这些极端的集中度(基尼系数 5 分别为 0.84 和 0.86)揭示了 AI 与任务契合度的巨大差异——最匹配的任务的使用量比匹配不佳的任务高出几个数量级。

考虑到它们不同的用户群和用例,跨平台的相似性尤其引人注目。两者都收敛于可比的集中度水平,这表明 AI 能力与相关经济任务之间存在共同的匹配过程。

像代码生成这样的任务占据主导地位,因为它们达到了一个最佳平衡点:模型能力出色,部署障碍最小,并且员工可以快速采用新技术。很少使用的任务的长尾可能反映了几个因素。6 例如,有些任务根本就不太常见——调试软件的频率远高于谈判马戏团合同。极端的集中度也暗示了 O-Ring 7 力量的潜在作用:如果一项任务需要 Claude 无法处理的推理水平、公司无法访问的内部数据,或者不存在的监管批准,任何单一的障碍都可能阻碍采用。

API 记录中的自动化与增强

API 和 Claude.ai 使用之间最明显的区别在于人类和 AI 如何分工。当企业将 Claude 嵌入到他们的应用程序中时,他们主要委托单个任务,而不是与模型进行迭代协作。

在我们的数据中,77% 的 API 记录显示出自动化模式(特别是完整的任务委托),而增强模式(例如,协作改进和学习)仅占 12%。根据来自 Claude.ai 的对话样本,自动化和增强之间的比例几乎是各占一半。纵观各项经济任务,通过 API 实现的 Claude 自动化程度甚至更加明显:97% 的任务在 API 使用中显示出以自动化为主导的模式,而 Claude.ai 上只有 47%(图 3.6)。

这在直觉上是合理的。编程 API 访问自然适合自动化:企业提供上下文,Claude 执行任务,输出直接流向最终用户或下游系统。

这种模式呼应了具有经济影响力的技术如何变得具有变革性:嵌入到系统中,让工人无需专门技能即可获得生产力提升。虽然增强和自动化方法都能提升人类能力,但系统级自动化可能会在整个经济中产生更大的生产力收益,并在劳动力市场中带来更显著的变化:完全自动化某些任务,改变哪些任务对各种工作很重要,甚至产生全新的工作形式。

Claude 做的越多,需要知道的就越多

为什么我们的 API 客户在某些任务上比其他任务更多地使用 Claude?除了基本的模型能力之外,一个潜在的重要解释是,对于某些任务来说,向 Claude 提供成功部署所需的信息比其他任务更容易。

例如,如果目标是让 Claude 重构复杂软件开发项目中的一个模块,Claude 可能需要阅读——或者至少探索——整个代码库,以了解要进行哪些更改以及在哪里进行更改。对于具有集中式代码存储库的软件开发,原则上获取这些信息是直截了当的。

对于其他任务,适当的上下文可能不容易获得,或者可能难以访问。例如,要求 Claude 为关键客户制定销售策略,可能不仅需要 Claude 访问客户关系管理系统中包含的信息,还需要访问位于客户主管、营销人员和外部联系人头脑中的隐性知识。在其他条件相同的情况下,缺乏对这些上下文信息的访问将使 Claude 的能力下降。

我们通过观察各项任务之间平均 API 输入长度(即提供给 Claude 的上下文)和 Claude 的平均输出长度(即模型响应产生的内容)之间的关系来探讨这个问题。8

对于我们样本中的每个 O*NET 任务,我们计算相关 API 记录的平均输入和输出长度。然后,我们将这些值除以出现在我们样本中的所有任务的平均长度。这为每个任务生成了一个输入 Token 指数和一个输出 Token 指数。例如,指数值为 1.5 意味着与该任务相关的 API 记录比所有任务的平均长度长 50%。

各项任务在 Claude 的 API 输出长度方面存在相当大的差异。例如,处于输出长度第 90 个百分位的任务比处于第 10 个百分位的任务长 4 倍以上。表 3.1 提供了示例 O*NET 任务,以及 Claude Sonnet 4 对分布在该部分任务组的总结。9 图 3.7 显示,输出长度在不同职业类别中也存在系统性差异。

从 Claude 对任务的评估中脱颖而出的是,较长输出的任务往往代表着越来越复杂的用途。当然,输出长度并不能捕捉任务复杂性的所有维度,但它似乎是一个合理且易于测量的代理指标。

由于 API 客户在输入 Token 和输出 Token 的边际上都要付费,因此他们有动机在利用 Claude 时优化模型提示,以最小化输入和输出 Token。反过来,输入长度和 Claude 产生的输出之间的任何系统性关系,都部分地捕捉了在为复杂任务部署 Claude 时的潜在上下文限制。换句话说,API 客户被激励只向 Claude 提供刚好足以实现其目标的上下文,而不再提供更多。因此,我们了解了具有不同输出长度的任务的上下文需求。

纵观各项任务,我们看到 API 客户向 Claude 提供多少上下文与 Claude 实际产生多少输出之间存在非常稳定的关系。在各项经济任务中,输入长度每增加 1%,输出长度就会出现低于比例的 0.38% 的增加(图 3.7)。这种 0.38 的弹性表明,在将较长的上下文输入转化为这些具有经济用途的任务的较长输出时,存在强烈的边际收益递减。10

结论是,为复杂任务部署 AI 可能更多地受限于信息访问,而不是底层模型能力。无法有效收集和组织上下文数据的公司可能会在复杂的 AI 部署中挣扎,从而为更广泛的企业采用造成潜在瓶颈——特别是对于那些隐性、分散的知识对业务运营至关重要的职业和行业。

每项任务的成本及任务间的替代模式

API 客户按 Token 付费,这导致了为不同任务部署 Claude 的成本存在差异。鉴于其较高的输入和输出 Token 数量,更复杂的任务往往成本更高。这种差异有助于我们探讨成本是否是决定企业选择使用 Claude 自动化哪些任务的主要因素。

数据表明并非如此,至少相对而言是这样。11 例如,计算机和数学职业的典型任务的成本比销售相关任务高出 50% 以上,但在使用量上却占据主导地位。12 总体而言,我们发现成本与使用量之间存在正相关关系:成本较高的任务往往具有较高的使用率(图 3.9)。

成本与使用量之间的正相关关系表明,成本在塑造企业 AI 部署模式方面发挥的作用微乎其微。相反,企业可能会优先在模型能力强且 Claude 驱动的自动化产生的经济价值超过 API 成本的领域使用。

虽然这种正相关关系总体上成立,但我们接下来要问的是,在其他方面相似但成本更高的任务中,对 Claude 能力的需求是否较低。需要注意的是,这应被视为初步探索,以下是我们的发现。

在控制了任务特征后,我们发现在我们的 API 记录样本中,成本每增加 1%,使用频率就会降低 0.29%(图 3.10)。13 虽然这符合标准经济学理论,即较高的价格会导致较低的需求,但成本下降所隐含的使用量增加是有限的。根据这一估计,特定任务的成本降低 10% 只会使使用量增加约 3%。

除了将 Claude 用于特定任务的成本之外,其他因素似乎对使用模式更为重要。

结论

我们的 API 数据捕捉到了处于早期阶段的企业 AI 采用:高度集中、以自动化为重点,并且对价格出奇地不敏感(至少在我们的 API 客户使用 Claude 执行的任务中是这样)。

77% 的自动化率表明,企业使用 Claude 来委托任务,而不是作为协作工具。这种系统性的企业部署很可能是 AI 在经济中带来更广泛生产力提升的重要渠道。鉴于业务部署中清晰的自动化模式,这也可能给劳动力市场带来破坏,可能会取代那些角色最有可能面临自动化的工人。

但对劳动力市场的影响并不完全清楚。正如我们在上文所记录的,复杂的任务需要不成比例的更多上下文。此类信息可能分散在整个组织中。在这种情况下,拥有关于业务运营隐性知识的工人可能会作为复杂 AI 驱动自动化的补充而受益。14 了解 AI 采用对劳动力市场的不均衡影响是未来研究的一个重要领域。

希望有效采用 AI 的企业可能需要重组他们组织和维护前沿系统所依赖的信息的方式。当今狭隘的、以自动化为主的采用是否会演变为更广泛的部署,可能会决定 AI 未来的经济影响。

  1. 在存在调整固定成本的情况下,企业面临的问题不一定是他们是否会采用 AI,而是何时采用。参见 Hall and Kahn 2003, Adoption of New Technology:“关于这种决策,最重要的一点是,在任何时间点做出的选择都不是在采用和不采用之间做出选择,而是在现在采用还是推迟决定之间做出选择。”
  2. 本节中的数据涵盖了 2025 年 8 月的 100 万份记录,这些记录是从占我们 1P API 使用量大约一半的 1P API 客户池中随机抽样的。我们继续根据我们的隐私和保留政策管理数据,我们的分析符合我们的条款、政策和合同协议。每条记录都是我们样本期间的一个提示-响应对,在某些情况下,这是多轮交互的会话中途。
  3. 请注意,这与本报告引言中的采用率衡量标准不同。消费者和员工报告的 AI 采用率在 2024 年达到 40%,而如果在企业层面衡量,美国十分之九的企业报告没有使用 AI。
  4. 由人口普查局发布的商业趋势和展望调查 (BTOS) 是衡量美国企业 AI 采用情况的可靠晴雨表。我们用来衡量 AI 采用情况的调查问题是“在过去两周内,该企业在生产商品或服务时是否使用了人工智能 (AI)?(AI 示例:机器学习、自然语言处理、虚拟代理、语音识别等)”。有关 BTOS 与其他衡量企业整体 AI 采用情况的指标的比较,请参见 Crane, Green, and Soto 2025, Measuring AI Uptake in the Workplace。
  5. 基尼系数是一种用于量化分布(例如任务使用分布)内不平等程度的指标。它的范围从 0 到 1,其中 0 代表完全平等(每个任务具有完全相同的使用份额),1 代表完全不平等(其中一个任务占据了所有使用量,而其他每个任务都没有)。
  6. 经济环境中的幂律是一种经验规律,特别是齐普夫定律 (Zipf’s law) 的著名例子。产生此类结果的模型具有潜在的异质性和有意的、优化的决策。了解更多,请参见 Gabaix 2016, Power Laws in Economics: An Introduction。
  7. Kremer 1993, The O-Ring Theory of Economic Development。
  8. API 输入长度是指 API 消息、系统提示以及发送给模型的任何其他内容(包括与手头任务相关的文件和数据集)中的文本。输出长度是指 Claude 对 API 调用的生成响应。
  9. Claude 被提示识别 ONET 任务分布中第 10、第 50 和第 90 个百分位的任务,并采用最小的组织形式:“列应该是‘示例任务’、‘指数值’、‘摘要’,并在其中提供摘要”。
  10. 另一个促成因素可能是某些模型在较长上下文长度下经历的性能下降。参见 Liu et al, 2023, Lost in the Middle: How Language Models Use Long Contexts。
  11. 我们在本节中提出的问题是,在其他条件相同的情况下,各项任务之间的成本差异是否塑造了相对使用模式。这不同于研究整体 Claude 使用量是否对外部竞争性定价压力敏感。
  12. 为了证明情况确实如此,我们首先按广泛的职业类别汇总我们在 API 样本中识别的 ONET 任务,以衡量整体使用份额和每个类别中每项任务的平均成本。与按 ONET 任务报告的输入和输出 Token 一样,我们将每项任务的平均成本除以我们样本中观察到的各项任务的平均值进行归一化。
  13. 控制变量包括广泛职业类别的固定效应,以及来自我们同时采样的 Claude.ai 对话的按任务划分的协作模式份额。由于某些任务的协作模式份额被截断,我们还包含了指示特定模式是否缺少数据的指标。我们将注意力限制在我们的 API 样本和 Claude.ai 样本中都识别出的任务集上。
  14. 例如,参见 Ide and Talamaś, 2025, Artificial Intelligence in the Knowledge Economy。

结语

第三版 Anthropic 经济指数报告捕捉到了处于关键时刻的 AI 采用情况。鉴于该技术的广泛适用性,Claude 和其他前沿 AI 系统的现有能力已经准备好改变经济活动。快速发展的 AI 能力只会强化这样一个结论:巨大的变革即将来临。然而,早期的 AI 采用却惊人地不均衡。目前的使用集中在一小部分任务上,具有强烈的地理差异,并且与收入高度相关——特别是在国家之间。这种集中反映了 AI 能力、部署便利性和经济价值的一致性:编程和数据分析的使用率很高,而需要分散上下文或复杂监管导航的任务则落后。

Claude 的早期企业采用既与消费者使用相似(编程是两者最常见的用途),又在几个重要方面有所不同。特别是,通过 API 以编程方式访问 Claude,企业倾向于以更高的自动化程度使用 Claude。这种系统性的企业部署反映了 AI 将如何重塑经济活动:提高整体生产力,但对那些现有职责已被自动化的工人来说,影响是不确定的。

这些模式有造成分化的风险。如果 AI 的生产力收益集中在已经繁荣的地区和准备好自动化的行业,现有的不平等可能会扩大而不是缩小。如果 AI 自动化提高了拥有隐性组织知识的工人的生产力——正如我们的一些证据所表明的那样——那么更有经验的工人可能会看到需求增加和工资上涨,即使入门级工人面临更糟糕的劳动力市场前景。1

在之前发布的基础上,本期指数报告标志着在范围和透明度方面的重大扩展。我们现在正在开源全面的 API 使用数据以及我们现有的 Claude.ai 消费者数据(现在包括州和国家级别的地理细分),所有这些都与详细的任务级分类相交叉。

通过公开这些数据,我们希望能够让其他人调查我们尚未考虑的问题,测试关于 AI 经济影响的假设,并制定基于经验证据的政策响应。

最终,变革性 AI 的经济影响将同样取决于技术能力和各社会做出的政策选择。

历史表明,技术采用的模式并不是固定不变的:它们会随着技术的成熟、互补创新的出现以及社会对其部署做出深思熟虑的选择而发生转变。我们今天观察到的高度集中的使用模式可能还会向更广泛的分布演变——这种分布能够捕捉到更多 AI 提升生产力的潜力,加速落后行业的创新,并促成新形式的经济价值创造。我们仍处于这场由 AI 驱动的经济转型的早期阶段。政策制定者、商业领袖和公众现在采取的行动将塑造未来的岁月。随着 AI 能力的进步,我们将继续跟踪这些模式,并为驾驭我们这个时代最重要的经济转型之一提供经验基础。

  1. Brynjolfsson, Chandar, and Chen 2025, Canaries in the Coal Mine? Six Facts about the Recent Employment Effects of Artificial Intelligence 记录了明确的证据,表明自 2022 年末以来,AI 暴露度高的入门级工人的就业前景相对较差。撇开因果关系问题不谈,直接的解释是这是由于 AI 替代了以前由早期职业工人完成的工作。Gans 2025, If AI and workers were strong complements, what would we see? 提出了另一种解释:经验丰富的工人相对较快的就业增长反映了 AI 使这些工人更有生产力,因此需求量很大。AI 是补充还是替代工作,也许是我们希望我们的数据能帮助回答的最重要的问题。

作者与致谢

Ruth Appel*, Peter McCrory*, Alex Tamkin*

Miles McCain, Tyler Neylon, Michael Stern

*主要作者。对本报告贡献均等

提供有益评论、讨论和其他协助的人员:Alex Sanchez, Andrew Ho, Ankur Rathi, Asa Kittner, Ben Merkel, Bianca Lindner, Biran Shah, Carl De Torres, Cecilia Callas, Daisy McGregor, Dario Amodei, Deep Ganguli, Dexter Callender III, Esin Durmus, Evan Frondorf, Heather Whitney, Jack Clark, Jakob Kerr, Janel Thamkul, Jared Kaplan, Jared Mueller, Jennifer Martinez, Kaileen Kelly, Kamya Jagadish, Katie Streu, Keir Bradwell, Kelsey Nanan, Kevin Troy, Kim O’Rourke, Kunal Handa, Landon Goldberg, Linsey Fields, Lisa Cohen, Lisa Rager, Maria Gonzalez, Mengyi Xu, Michael Sellitto, Mike Schiraldi, Olivia Chen, Paola Renteria, Rebecca Jacobs, Rebecca Lee, Ronan Davy, Ryan Donegan, Saffron Huang, Sarah Heck, Stuart Ritchie, Sylvie Carr, Tim Belonax, Tina Chin, Zoe Richards

相关文档

关联主题