摘要
1) 一句话总结 第三份《Anthropic 经济指数》报告通过分析 Claude 在全球、美国各州及企业 API 的使用数据,揭示了 AI 采用率与地区经济结构及收入的强相关性,并指出 AI 自动化任务的比例已首次超过人类增强协作。
2) 关键要点
- 全球采用与收入挂钩:引入了经适龄工作人口调整的“Anthropic AI 使用指数(AUI)”,发现国家人均 GDP 每高出 1%,AUI 就高出 0.7%;美国绝对使用量领先,而以色列和新加坡等技术先进的小国在人均采用率上领先。
- 美国各州使用契合当地产业:美国国内人均 GDP 与使用量的正相关性更强(1% GDP 增长对应 1.8% 使用量增长),且各州使用偏好高度契合当地经济结构(如加州偏重编程,纽约偏重金融,夏威夷偏重旅游)。
- 任务类型向知识密集型转移:计算机和数学任务仍占主导(37-40%),但教育指导(增至 13%)和科学研究(增至 8%)等知识密集型任务显著增长,传统商业和管理任务占比则出现下降。
- 自动化首次超越增强协作:“指令性”自动化任务比例从 27% 激增至 39%,使得整体自动化比例(49.1%)首次超过人类与 AI 协作的“增强”比例(47%)。
- 采用率与自动化程度呈反比:人均使用量较高的国家更倾向于“增强协作”,而使用量较低的国家更倾向于“自动化”(经人口调整后的使用量每增加 1%,自动化程度降低约 3%)。
- 企业 API 用户极度偏好自动化:企业 API 流量高度集中于计算机或数学任务(44%),且 77% 的 API 对话显示出自动化模式(仅 12% 为增强模式),远高于普通消费者端。
- 价值驱动而非成本驱动:在企业 API 使用中,任务成本(消耗的 token 数量)与使用频率呈正相关,表明模型产生的经济价值比完成任务的成本更受企业重视。
- 数据开源:Anthropic 已将包含地理数据、任务级别使用模式及 API 概览的数据集公开,并上线了交互式网站供公众查询。
3) 风险与缺口
- 加剧全球经济分化风险:报告明确指出,如果 AI 的影响在较富裕国家被证明是最大的,这种通用技术可能会像过去的电气化一样,导致世界各地生活水平出现巨大的经济分化。
- 劳动力市场冲击风险:企业 API 用户使用 Claude 自动化任务的可能性明显高于消费者,报告指出这表明劳动力市场可能即将迎来重大影响。
- 数据滥用现象:在分析美国各州数据时,发现犹他州的高使用量中有相当一部分与“协同滥用(coordinated abuse)”的指标有关(尽管稳健性检验表明其未主导最终整体结果)。
正文
在夏威夷规划旅行,在马萨诸塞州进行科学研究,在印度构建 Web 应用程序。表面上看,这三项活动几乎毫无共同之处。但事实证明,它们分别是 Claude 在这些地区最具代表性的特定用途。
这并不意味着它们是最受欢迎的任务:在世界上几乎每个州和国家,软件工程仍然遥遥领先。相反,这意味着马萨诸塞州的人比其他地方的人更有可能向 Claude 寻求科研帮助——或者,例如,巴西的 Claude 用户似乎对语言特别热衷:他们使用 Claude 进行翻译和语言学习的频率约为全球平均水平的六倍。
这些是我们从第三份《Anthropic 经济指数》报告中发现的统计数据。在最新一期报告中,我们加大了力度,记录了正在开始重塑工作和经济的早期 AI 采用模式。我们衡量了 Claude 在以下方面的不同使用情况……
-
……在美国国内:我们首次对美国各州之间 AI 使用情况的差异进行了详细评估。我们发现,各州经济的构成决定了哪些州的人均 Claude 使用量最高——而且令人惊讶的是,使用量最高的州并不是那些以编程为主导的州。
-
……在不同国家之间:我们的新分析发现,各国对 Claude 的使用与收入密切相关,并且与高使用率国家相比,低使用率国家的人们更频繁地使用 Claude 来自动化工作。
-
……随着时间的推移:我们将最新数据与 2024 年 12 月至 2025 年 1 月以及 2025 年 2 月至 3 月的数据进行了比较。我们发现,“指令性”(directively)自动化任务的比例从 27% 激增至 39%,这表明 AI 承担的责任(以及用户的信任度)正在迅速增加。
-
……以及企业用户:我们现在纳入了来自 Anthropic 第一方 API 客户的匿名数据(除了 Claude.ai 的用户之外),这使我们首次能够分析企业的交互情况。我们发现,API 用户使用 Claude 自动化任务的可能性明显高于消费者,这表明劳动力市场可能即将迎来重大影响。
我们在下文对报告进行了总结。此外,我们还设计了一个交互式网站,您可以亲自探索我们的数据。您首次可以搜索美国每个州以及我们追踪的所有职业中 Claude.ai 使用情况的趋势和结果,以了解您所在地区或从事类似工作的人是如何使用 AI 的。最后,如果您想在我们的分析基础上进行深入研究,我们已将我们的数据集与之前《经济指数》报告的数据一起公开提供。
地理分布
我们扩展了《Anthropic 经济指数》以纳入地理数据。下面我们将介绍关于 Claude 在各国和美国各州使用情况的发现。
各国情况
美国对 Claude 的使用量远超其他任何国家。印度位居第二,其次是巴西、日本和韩国,这几个国家的份额相近。
然而,这些国家的人口规模存在巨大差异。为了解决这个问题,我们根据各国在全球工作人口中的比例,对其 Claude.ai 使用份额进行了调整。由此得出了我们的 Anthropic AI 使用指数(Anthropic AI Usage Index,简称 AUI)。AUI 大于 1 的国家,其使用 Claude 的频率高于我们仅根据其适龄工作人口所预期的频率,反之亦然。
从 AUI 数据中我们可以看出,相对于其适龄工作人口,一些技术先进的小国(如以色列和新加坡)在 Claude 的采用方面处于领先地位。这在很大程度上可能与收入有关:我们发现人均 GDP 与 Anthropic AI 使用指数之间存在很强的相关性(人均 GDP 每高出 1%,AUI 就高出 0.7%)。这是合理的:最常使用 Claude 的国家通常也拥有强大的互联网连接,并且其经济以知识型工作而非制造业为主导。但这确实引发了一个关于经济分化的问题:以前的通用技术(如电气化或内燃机)既带来了巨大的经济增长,也导致了世界各地生活水平的巨大分化。如果 AI 的影响在较富裕国家被证明是最大的,那么这种通用技术可能会产生类似的经济影响。
美国国内模式
在比较美国各州时,人均 GDP 与人均 Claude 使用量之间的联系同样成立。事实上,在美国国内,使用量随收入增长的速度比在国家之间更快:美国国内人均 GDP 每高出 1%,经人口调整后的 Claude 使用量就高出 1.8%。尽管如此,收入在美国国内的解释力实际上低于在国家之间的解释力,因为整体趋势内的方差要大得多。也就是说:除了收入之外,其他因素必然解释了经人口调整后使用量的更多差异。
还有什么能解释这种采用差距呢?我们最好的猜测是各州经济构成的差异。美国 AUI 最高的是哥伦比亚特区(3.82),在那里,Claude 最不成比例的频繁用途是编辑文档和搜索信息,以及与华盛顿特区知识型工作相关的其他任务。同样,与编程相关的任务在加利福尼亚州(总体 AUI 排名第三的州)尤为常见,而与金融相关的任务在纽约州(排名第四)尤为常见。1 即使在夏威夷等经人口调整后 Claude 使用量较低的州,其使用情况也与经济结构密切相关:夏威夷人要求 Claude 协助处理旅游相关任务的频率是美国其他地区的两倍。我们的交互式网站包含大量类似这样的统计数据。
Claude 使用趋势
自 2024 年 12 月以来,我们一直在追踪人们如何使用 Claude。我们使用一种保护隐私的分类方法,将匿名的对话记录分类到由 ONET 定义的任务组中。ONET 是一个美国政府数据库,用于对工作及其相关任务进行分类。2 通过这种方式,我们不仅可以分析自去年以来人们交给 Claude 的任务发生了怎样的变化,还可以分析人们选择协作的方式——他们选择对 Claude 的工作进行多少监督和投入——发生了怎样的变化。
任务
自 2024 年 12 月以来,计算机和数学类用途在我们的类别中一直占据主导地位,约占对话的 37-40%。
但情况发生了很多变化。在过去的九个月里,我们看到“知识密集型”领域持续增长。例如,教育指导任务增加了 40% 以上(从占所有对话的 9% 升至 13%),与自然科学和社会科学相关的任务份额增加了三分之一(从 6% 升至 8%)。与此同时,传统商业任务的相对频率有所下降:与管理相关的任务从占所有对话的 5% 降至 3%,与商业和金融运营相关的任务份额减半,从 6% 降至 3%。(当然,从绝对数量来看,每个类别中的对话数量仍然显著增加。)
整体趋势存在噪音,但总的来说,随着一个国家人均 GDP 的增加,Claude 的使用会从计算机和数学职业组的任务转移,转向各种其他活动,如教育、艺术和设计;办公室和行政支持;以及自然科学和社会科学。请将下方第一张图表中的趋势线与其余三张进行比较:
尽管如此,在我们追踪的每一个国家中,软件开发仍然是最常见的用途。美国的情况看起来也很相似,尽管我们的样本量限制了我们更详细地探索任务组合如何随采用率变化的能力。
交互模式
正如我们之前所讨论的,我们通常区分涉及自动化(automation,即 AI 在极少用户输入的情况下直接生成工作成果)和增强(augmentation,即用户与 AI 协作完成任务)的任务。我们进一步将自动化细分为指令性(directive)和反馈循环(feedback loop)交互,其中指令性对话涉及最少的人类交互,而在反馈循环任务中,人类将现实世界的结果反馈给模型。我们还将增强细分为学习(learning,询问信息或解释)、任务迭代(task iteration,与 Claude 协作工作)和验证(validation,寻求反馈)。
自 2024 年 12 月以来,我们发现指令性对话的比例急剧上升,从 27% 升至 39%。因此,其他交互模式(特别是学习、任务迭代和反馈循环)的比例略有下降。这意味着总体而言,自动化(49.1%)首次变得比增强(47%)更常见。对此的一个潜在解释是,AI 正在迅速赢得用户的信任,并越来越多地承担起完成复杂工作的责任。
这可能是模型能力提升的结果。(在 2024 年 12 月我们首次为经济指数收集数据时,Claude 的最新版本是 Sonnet 3.6。)随着模型在预测用户需求和生成高质量工作成果方面变得越来越好,用户可能更愿意在第一次尝试时就信任模型的输出。
也许令人惊讶的是,在人均 Claude 使用量较高的国家,Claude 的用途倾向于增强;而在使用量较低的国家,人们更倾向于自动化。在控制相关任务组合的情况下,经人口调整后的 Claude 使用量每增加 1%,自动化程度就会降低约 3%。同样,经人口调整后的 Claude 使用量的增加与远离自动化(如下方图表所示)相关,而不是趋向自动化。
我们目前还不确定原因。这可能是因为每个国家的早期采用者更习惯于让 Claude 自动化任务,或者这可能归因于其他文化和经济因素。
企业
使用与我们在 Claude.ai 对话中相同的隐私保护方法,我们开始从 Anthropic 的一部分第一方 API 客户中抽取交互样本,这是一项首创的分析。3 API 客户(通常是企业和开发者)使用 Claude 的方式与通过 Claude.ai 访问它的用户截然不同:他们按 token 付费,而不是支付固定的月度订阅费,并且可以通过自己的程序发出请求。
这些客户对 Claude 的使用特别集中在编程和管理任务上:我们样本中 44% 的 API 流量映射到计算机或数学任务,而 Claude.ai 上的这一比例为 36%。(碰巧的是,大约 5% 的 API 总流量专门集中在开发和评估 AI 系统上。)这被与教育职业(API 中为 4%,而 Claude.ai 上为 12%)以及艺术和娱乐(5% 对比 8%)相关的对话比例较小所抵消。
我们还发现,我们的 API 客户使用 Claude 进行任务自动化的频率远高于 Claude.ai 用户。我们 77% 的 API 对话显示出自动化模式,其中绝大多数是指令性的,而只有 12% 显示出增强模式。在 Claude.ai 上,两者的比例几乎持平。这可能会产生重大的经济影响:在过去,任务的自动化通常与大规模的经济转型以及生产力的重大提升相关联。
最后,考虑到 API 使用的付费方式,我们还可以探讨任务成本的差异(由它们消耗的 token 数量差异引起)是否会影响企业选择“购买”哪些任务。在这里,我们发现价格与使用量之间存在正相关:成本较高的任务类别往往使用频率更高,如下方图表所示。这向我们表明,基础模型的能力以及模型产生的经济价值,对企业来说比完成任务本身的成本更重要。
结论
经济指数旨在提供关于 AI 如何影响人们的工作和经济的早期实证评估。到目前为止我们发现了什么?
在本报告涵盖的各项指标中,AI 的采用情况似乎极不均衡。高收入国家的人们更有可能使用 Claude,更有可能寻求协作而不是自动化,并且更有可能追求编程以外的广泛用途。在美国国内,AI 的使用似乎受到当地经济主导产业(从科技到旅游业)的强烈影响。而且,与消费者相比,企业更有可能赋予 Claude 代理权和自主权。
除了不均衡这一事实之外,我们特别注意到,在过去的九个月里,指令性自动化在 Claude.ai 的对话中变得越来越普遍。人们使用 Claude 的性质显然仍在定义之中:我们仍在共同决定我们对 AI 工具的信任程度,以及我们应该赋予它们多少责任。不过,到目前为止,看起来我们对 AI 越来越适应,并愿意让它代表我们工作。我们期待着随着时间的推移重新审视这项分析,看看随着 AI 模型的改进,用户的选择会落在哪里——或者,是否会稳定下来。
如果您想亲自探索我们的数据,可以在我们专门的 Anthropic 经济指数网站上进行,该网站包含我们国家、州和职业数据的交互式可视化图表。未来我们将用更多数据更新此网站,以便您可以继续以您感兴趣的方式追踪 AI 对工作和经济影响的演变。
我们的完整报告可在此处获取。我们希望它能帮助政策制定者、经济学家和其他人更有效地为 AI 带来的经济机遇和风险做好准备。
开放数据
与我们过去的报告一样,我们为此次发布提供了一个全面的数据集,包括地理数据、任务级别的使用模式、按任务划分的自动化/增强细分,以及 API 使用概览。数据可在 Anthropic 经济指数网站下载。
加入我们
如果您有兴趣在 Anthropic 工作,帮助构建支持这项研究的系统,我们鼓励您申请我们的研究工程师(Research Engineer)职位。
-
至于排名第二的犹他州:在进一步调查犹他州的活动时,我们发现其相当一部分使用量似乎与协同滥用的指标有关——这也反映在犹他州远高于平均水平的“指令性”自动化得分上。然而,我们进行了稳健性检验,认为这种活动并未主导最终结果。
-
我们用一种“自下而上”的任务分类来补充这一点,即 Claude 根据自己的分类法对对话进行分类,以弥补 O*NET 类别中的任何空白。我们保护隐私的分析方法的完整细节可在此处获取。
-
本节数据涵盖了 2025 年 8 月的 100 万份对话记录,这些记录是从占我们第一方 API 使用量约一半的第一方 API 客户池中随机抽取的。我们继续根据我们的隐私和保留政策管理数据,我们的分析符合我们的条款、政策和合同协议。
相关文档
- Anthropic 经济指数 2025 年 9 月报告:地理与企业采用差异;关联理由:同一事件;说明:两文都基于同一轮经济指数数据,且都覆盖地理分布与企业自动化采用差异。
- 衡量 AI 智能体在实践中的自主性;关联理由:延伸思考;说明:该文聚焦“自动化与自主性”的实证衡量,可延伸理解本报告里自动化占比上升背后的行为机制。
- 印度国家简报:Anthropic 经济指数;关联理由:版本演进;说明:该文在后续经济指数数据上给出国家级深挖,可与本报告的全球/美国地理结论形成前后对照。
- Anthropic 经济指数:理解 AI 使用的新基石;关联理由:版本演进;说明:该文汇总后续版本的“经济基元”框架,并更新了自动化与地理扩散趋势,可作为本报告的后续主线阅读。