OpenAI 将如何竞争

摘要

1) 一句话总结 OpenAI 尽管拥有庞大的用户基础和前沿技术，但目前缺乏网络效应、自有分发渠道和明确的产品市场契合度，正试图通过巨额的算力投资和构建全栈平台生态来抵御基础模型商品化的趋势并确立持久的竞争优势。

2) 关键要点

缺乏绝对技术护城河：目前约有 6 家机构发布了能力相当的前沿模型，各家交替领先，OpenAI 尚未建立类似 Windows 或 iOS 的网络效应或赢家通吃机制。
用户参与度较浅：OpenAI 拥有 8 至 9 亿周活跃用户，但仅有 5% 为付费用户；2025 年数据显示，80% 的用户全年发送消息少于 1000 条（平均每天不到 3 个提示词），缺乏深度的日常使用习惯。
分发渠道劣势：与 Google 和 Meta 等巨头相比，OpenAI 缺乏现有的成熟产品作为分发渠道，而竞争正逐渐从模型能力转向品牌和分发优势。
产品战略受限：OpenAI 的产品路线图高度依赖实验室的技术突破（由技术推导产品），而非从客户体验反推需求，导致产品团队对战略的控制力有限。
巨额资本支出（Capex）竞赛：四大云厂商去年基础设施支出约 4000 亿美元，今年计划投入 6500 亿美元；OpenAI 报告 2025 年底使用算力为 1.9 吉瓦，并宣称拥有 1.4 万亿美元和未来 30 吉瓦的算力承诺，试图以此在牌桌上占据一席之地。
平台化战略的局限：OpenAI 试图打造全栈平台（从芯片、模型到应用），但由于 API 调用缺乏排他性，终端用户并不关心底层模型归属，难以形成真正的开发者锁定和生态飞轮。

3) 风险/缺口

资金与现金流风险：在历史上资本最密集的行业之一中竞争，OpenAI 缺乏现有成熟业务的现金流来支撑巨额的固定成本和算力投入。
基础模型商品化风险：随着竞争加剧，基础模型本身面临沦为以边际成本出售的商品化基础设施的风险。
产品差异化与用户流失风险：聊天机器人本质上是难以区分的“套壳应用”，由于缺乏网络效应，OpenAI 在采用率上的早期领先地位非常脆弱，用户极易流失或转向竞争对手。
生态整合阻力（小组件谬误）：OpenAI 试图通过 API 和标准将各种外部服务整合到 ChatGPT 中，但这面临着复杂产品难以被简单接口抽象的现实困难，且第三方开发者和企业缺乏被单一平台锁定的意愿。

正文

“Jakub 和 Mark 设定了长期的研究方向。然后经过几个月的工作，一些令人难以置信的东西出现了，我收到一位研究员发来的消息说：‘我做出了一个非常酷的东西。你打算如何在聊天中使用它？你打算如何在我们的企业产品中使用它？’”

—— Fidji Simo，OpenAI 产品负责人，2026 年

“你必须从客户体验出发，然后反推所需的技术。你不能从技术出发，然后试图弄清楚你要把它卖到哪里去。”

—— 史蒂夫·乔布斯，1997 年

在我看来，OpenAI 面临着四个根本性的战略问题。

首先，就我们今天所看到的业务而言，它并没有强大、清晰的竞争优势。它没有独特的技术或产品。这些模型拥有非常庞大的用户群，但参与度和用户粘性非常窄，而且到目前为止，还没有网络效应或任何其他赢家通吃效应，能够提供一条清晰的路径将该用户群转化为更广泛、更持久的东西。OpenAI 在模型本身之上也没有具备产品市场契合度（product-market fit）的消费者产品。

其次，随着市场的发展，AI 领域的体验、产品、价值捕获和战略杠杆在未来几年都将发生巨大变化。庞大且激进的现有巨头和成千上万的创业者正试图创造新的功能、体验和商业模式，并在此过程中试图将基础模型本身变成以边际成本出售的商品化基础设施。在掀起大语言模型（LLM）热潮之后，OpenAI 现在还必须发明一整套全新的东西，或者至少要抵御、拉拢并吸收成千上万试图做同样事情的其他人。

第三，虽然这其中的大部分也适用于该领域的其他所有人，但 OpenAI 和 Anthropic 一样，必须在没有现有产品作为分发渠道并使这一切成为一项功能的情况下，跨越“混乱的中间阶段”（messy middle）的“鸿沟”（cross the chasm，此处可代入你最喜欢的创业书籍标题）；并且要在历史上资本最密集的行业之一中竞争，而没有现有业务的现金流可以依赖。当然，拥有所有这些条件的公司也需要能够颠覆自己，但我们早已过了人们说谷歌做不好 AI 的阶段。

第四个问题体现在我上面引用的名言中。Mike Krieger 和 Kevin Weil 去年也表达过类似的观点：当你是一家 AI 实验室的产品负责人时，你无法控制你的路线图。你制定产品战略的能力非常有限。你早上打开电子邮件，发现实验室已经研发出了某个东西，而你的工作就是把它变成一个按钮。战略是在其他地方制定的。但在哪里呢？

至少可以说，OpenAI 仍然在设定新模型的议程，它拥有大量出色的技术和许多聪明、雄心勃勃的人才。但与 2000 年代的谷歌或 2010 年代的苹果不同，这些人并没有一个已经真正行之有效且其他人无法做到的东西。我认为，看待 OpenAI 过去 12 个月动向的一种方式是，Sam Altman 深知这一点，并且正试图在音乐停止之前，尽一切努力用他的高估值筹码换取更持久的战略地位。

让我们从模型开始。

有许多基准测试，它们都是“错的”，但它们都展示了相同的图景。

目前大约有六家机构正在发布具有竞争力的前沿模型，它们的能力几乎相当。每隔几周，它们就会互相超越。这些能力内部存在差异，有可能会掉队（比如目前的 Meta），或者未能跟上步伐（比如目前的 Apple、Amazon、Microsoft），或者落后前沿水平六个月（中国），或者严重依赖他人的工作（还是中国），而且所有这些都需要大量的资金（下文会详细讨论），但在今天，我们还不知道有什么机制能让一家公司获得该领域其他公司永远无法匹敌的领先优势。这里没有类似于 Windows、谷歌搜索、iOS 或 Instagram 等产品中看到的网络效应——在那些产品中，市场份额是自我强化的，其他人无论投入多少金钱和努力都不足以打破壁垒或迎头赶上。

如果出现能够促成网络效应的突破（最明显的例子是持续学习），这种情况可能会改变，但我们无法将计划建立在它一定会发生的基础上。如果围绕专有数据的访问出现了实际的规模效应，情况也可能发生改变。如今，专有数据是 AI 的“暗物质”：这可能是用户数据（但目前尚不清楚这里的规模效应会是什么样，而且现有的平台公司已经拥有大量数据），或者是垂直数据（基础模型不知道 SAP 或 Salesforce 内部发生了什么，也没有投资银行内部数以百万计的电子表格，尽管你有时可以购买这些数据或花钱雇人制作，但其他所有大玩家也可以这样做）。这里可能还有其他因素，但目前我们还不知道，你也无法为此制定计划，因此我们必须假设，在一段时间内，各家模型之间的差距将保持非常微小的状态。

如今 OpenAI 确实拥有明显领先优势的一个地方是用户群：它拥有 8 到 9 亿用户。问题在于，这些只是“周活跃”用户：即使在那些已经知道这是什么以及如何使用它的人中，绝大多数人也没有将其变成日常习惯。只有 5% 的 ChatGPT 用户是付费用户，甚至美国青少年每周使用几次或更少频率的可能性，也远高于他们每天使用多次的可能性。OpenAI 在其“2025 年度回顾”（2025 wrapped）推广活动中发布的数据告诉我们，80% 的用户在 2025 年发送的“消息”少于 1000 条。我们不知道这一数据在这一年中发生了怎样的变化（可能有所增长），但从表面上看，这平均每天不到三个提示词（prompts），而单独的对话次数则更少。其使用情况是“广度有一英里，深度却只有一英寸”。

这意味着大多数人看不出你可能会注意到的模型个性和侧重点之间的差异，而且大多数人也没有从“记忆”或其他功能中受益——各家公司的产品团队互相抄袭这些功能，希望能建立用户粘性（而记忆只是粘性，不是网络效应）。与此同时，来自更大（目前而言）用户群的使用数据本身可能是一种优势，但如果 80% 的用户最多每周只使用几次，这种优势到底有多大？

这种参与度显然是一个“杯子是半满还是半空？”的问题，但这本应是一场关于你如何使用计算机的变革。如果人们最多每周只使用几次，并且在平常的日子里想不出用它来做什么，那么它并没有改变他们的生活。OpenAI 自己也承认了这个问题，谈到了模型能做什么和人们用它们做什么之间存在“能力差距”（capability gap），在我看来，这似乎是一种避免直接承认你没有清晰的产品市场契合度（PMF）的说法。

因此，OpenAI 的广告项目部分只是为了支付为 90% 或更多不付费用户提供服务的成本（并在广告商中占据早期领先地位，以及尽早了解这可能如何运作），但从更具战略意义的角度来看，这也是为了能够为这些用户提供最新、最强大（即最昂贵）的模型，希望借此加深他们的参与度。Fidji Simo 在这里说过，“普及和规模是最重要的事情。”这可能会奏效（尽管这也可能促使他们付费，或者促使他们转向 Gemini）。但如果有人今天或本周想不出用 ChatGPT 做什么，你给他们一个更好的模型，情况就会改变，这并不是不言而喻的。情况可能会改变，但同样可能的是，他们被困在了“面对空白屏幕不知道问什么”的问题上，或者无论模型有多好，聊天机器人本身对于他们的用例来说就不是合适的产品和体验。

与此同时，当你拥有一个无差异化的产品时，采用率上的早期领先往往是不持久的，竞争往往会转移到品牌和分发渠道上。我们今天可以在 Gemini 和 Meta AI 市场份额的快速增长中看到这一点：对于典型用户来说，这些产品看起来非常相似（尽管科技界人士认为 Llama 4 是一场惨败，但 Meta 的数据似乎很好），而 Google 和 Meta 拥有可以利用的分发渠道。相反，Anthropic 的 Claude 模型经常在基准测试中名列前茅，但它没有消费者战略或产品（Claude Cowork 竟然要求你安装 Git！），消费者认知度也几乎为零。

这导致许多人将 ChatGPT 与 Netscape 进行比较，当时 Microsoft 利用分发渠道强行挤入了一个产品本身难以区分的市场，就像今天的 Google 和 Meta 所做的那样。

进一步来看，比较一下当年区分网络浏览器有多难，以及今天区分聊天机器人有多难，是一件很有趣的事情：这看起来是同一个问题。你可以改进浏览器中的渲染引擎，也可以改进聊天机器人中的 LLM，但浏览器本身和聊天机器人本身，都只是一个输入框和一个输出框。ChatGPT 应用程序，就像所有的聊天机器人应用程序一样，只是一个“套壳应用”（thin wrapper）——你如何让你的与众不同？在浏览器领域，答案是你做不到——最后成功的创新是标签页以及将搜索与 URL 栏合并。今天的聊天机器人面临着同样的问题——你还能添加多少个小按钮，你又如何区分它们？

不过，最终 Microsoft 赢得了第一代消费互联网的浏览器大战，但这结果证明并不重要，因为真正重要的体验和价值捕获是在其他地方创造的。同样，对于“参与度差距”的真正问题在于，这究竟是通过我们必须假定将适用于整个行业的普遍模型改进来解决，还是通过所有人都会抄袭的 UI 创新来解决，亦或是随后在“原始”模型之上发明和创造新的实验和用例来解决。

如果下一步是那些新的体验，谁来做？为什么会是 OpenAI？整个科技行业都在试图发明生成式 AI 体验的第二步——你如何能计划让它成为你？你如何与这张图表竞争——与硅谷的每一位创业者竞争？

所以：你不知道如何让你的核心技术比其他任何人都好。你有一个庞大的用户群，但参与度有限，而且看起来非常脆弱。主要的现有巨头已经或多或少地赶上了你的技术，并正在利用他们的产品和分发优势来追逐市场。而且，看起来很多价值和杠杆将来自尚未发明的新体验，而你不可能自己发明所有这些。你该怎么办？

在去年的大部分时间里，感觉 OpenAI 的答案是“所有东西，同时进行，昨天就要”。一个应用平台！不，另一个应用平台！一个浏览器！一个社交视频应用！Jony Ive！医学研究！广告！还有更多我忘记的东西！当然，还有数万亿美元的资本支出（capex）公告，或者至少是资本支出愿景。

其中一些看起来像是“饱和式攻击”（flooding the zone），或者至少只是快速雇佣了大量积极进取、雄心勃勃的人才的结果。有时也让人感觉人们在抄袭以前成功平台的形式，却并不完全理解它们的目的或动态：“平台都有应用商店，所以我们需要一个应用商店！”

但在去年年底，Sam Altman 试图将这一切整合在一起，展示了这张图表，并引用了比尔·盖茨的名言：平台的定义是它为合作伙伴创造的价值大于为自己创造的价值。

几乎在同一时间，首席财务官（CFO）发布了这张图表。

公益公告（PSA）：资本支出和收入之间 1:1 的关系不是飞轮

这是一个漂亮、整洁、连贯的战略。你的资本支出本身就是一个良性循环，它是建立一个全栈（full-stack）平台公司计划的基础。你构建了技术栈的每一层，从芯片和基础设施向上，你越往技术栈的上层走，你就越能帮助其他人使用你的工具创造他们自己的东西。每个人都可以使用你的云、你的芯片、你的模型，然后更进一步，技术栈的各层相互强化。你拥有网络效应，你拥有生态系统，你拥有上下游的杠杆，每个人都在你的东西上进行构建，每个人都被锁定了。其他人可能也会构建该技术栈的某些部分，但你拥有一个可防御的、差异化的、能够捕获价值的平台。

这确实是 Windows 或 iOS 的运作方式。问题在于，我真的认为这不是一个合适的类比。我认为 OpenAI 并不具备这些。它没有 Microsoft 或 Apple 那种平台和生态系统动态，而且那个飞轮图表实际上并没有展示出一个飞轮。

让我们先谈谈资本支出。这是吸引所有人注意力的东西，因为科技行业以前从未考虑过如此庞大的数字。四大云服务公司去年在基础设施上花费了大约 4000 亿美元，并宣布今年计划至少投入 6500 亿美元。

众所周知，OpenAI 一直在四处奔走试图加入这个俱乐部，几个月前声称拥有 1.4 万亿美元和未来 30 吉瓦（gigawatts）的算力承诺（没有时间表），而其报告称 2025 年底使用的算力为 1.9 吉瓦。由于它没有超大规模云服务商（hyperscalers）可以利用的现有业务的现金流规模，到目前为止，它设法通过结合融资（并非所有融资都必然已完成交割）和其他人的资产负债表（其中一些也是著名的“循环收入”）来做到这一点，或者至少是宣布了这一点。

你可以观看大量长达三小时的播客来讨论所有这些，很多人对 TPU、Nvidia 的产品领先地位，以及 Oracle 以不断下滑但能产生现金流的传统业务为抵押进行借贷，从而烧钱进入新领域的战略发表了看法，但我们其他人应该关心多少呢？这是一条通往竞争优势的道路，还是仅仅是在牌桌上获得一个席位？

我们并不真正知道 AI 基础设施的长期成本会是什么样，但这很可能就像客机或半导体的制造一样：没有网络效应，但每一代工艺都变得更加困难和昂贵，因此这些行业已经从处于前沿的几十家公司变成了只有一边的 Boeing 和 Airbus，以及另一边的 TSMC。半导体制造既有大家都听说过的摩尔定律（Moore’s Law），也有大多数人没听说过的洛克定律（Rock’s Law）：摩尔定律指出，芯片上的晶体管数量每两年翻一番，但洛克定律指出，最先进的半导体晶圆厂的成本每四年翻一番。也许生成式 AI 也会以同样的方式运作，单位成本下降，但固定成本上升，以至于只有少数几家公司能够维持构建竞争模型所需的投资，而其他所有人都被挤出局。* 这种寡头垄断大概会有一个价格均衡，尽管它可能是高利润或低利润——这可能都只是以边际成本出售的商品化基础设施，特别是考虑到牌桌上的一些人将使用他们的模型来驱动其他更具差异化的业务。去问问你最喜欢的经济学家吧。**

因此，当 Sam Altman 说他筹集了 1000 亿或 2000 亿美元时，当他说他希望 OpenAI 每周建设一吉瓦的算力时（这意味着每年大约一万亿美元的资本支出），人们很容易嘲笑这是“吹牛瓦”（braggawatts），显然 TSMC 的人曾经把他斥为“播客老哥”（podcast bro），但他正试图创造一个自我实现的预言。他正试图通过意志力，让 OpenAI 这个三年前还没有收入的公司，在一张你可能需要每年在基础设施上花费数千亿美元的牌桌上获得一个席位。到目前为止，他的意志力已被证明是非常强大的。

但是，再说一次，这除了让你在牌桌上获得一个席位之外，还能给你带来什么吗？TSMC 不仅是一个寡头——它在尖端芯片上拥有事实上的垄断地位——但这并没有给它在技术栈更上层带来什么杠杆作用或价值捕获。人们构建 Windows 应用程序、Web 服务和 iPhone 应用程序——他们不构建 TSMC 应用程序或 Intel 应用程序。

开发者必须为 Windows 进行开发，因为它拥有几乎所有的用户，而用户必须购买 Windows PC，因为它拥有几乎所有的开发者（一种网络效应！）。但是，如果你使用生成式 AI 发明了一个出色的新应用程序、产品或服务，或者将其作为功能添加到现有产品中，你使用的是 API 来调用在云端运行的基础模型，而用户不知道也不关心你使用的是什么模型。使用 Snap 的人不在乎它是运行在 AWS 还是 GCP 上。当你购买企业 SaaS 产品时，你不在乎它使用的是 AWS 还是 Azure。如果我进行一次 Google 搜索，第一个匹配项是一个运行在 Google Cloud 上的产品，我永远也不会知道。

这并不意味着这些 API 是可以互换的——AWS、GCP 和 Azure 拥有截然不同的市场份额，以及开发者选择它们的原因，都有其充分的理由。但客户不知道也不关心。运营云服务并不能让你对技术栈更上层的第三方产品和服务拥有杠杆。

现在的不同之处或许在于，所有这些服务过去都是孤立的孤岛：在 Google 和 Facebook 中，顶部有一个共同的搜索和发现层，在云端底部有共同的基础设施，但所有这些应用程序从未相互连接。现在，我们看到了一个新兴的、由模型和网站相互通信的标准和协议组成的“字母汤”（alphabet soup），涵盖了广告、电子商务以及某种意图和自动化（围绕 OpenClaw 的短暂热情捕捉到了其中的一部分）。网站可以展示其功能，以便其中的一部分可以直接显示在 ChatGPT 中，无论它是房地产搜索还是购物车。你会告诉你的智能体（agent）在 Instagram 上看一个食谱，然后在 Instacart 上订购食材。一切都可以连接到其他一切，一切都可以相互对话！

与此同时，（把潜台词说出来），如果你能设定并控制这些 API 并管理这些流量，那就会赋予你权力。在每一代技术中，标准一直是一种基本的竞争武器——还记得 Microsoft 的口号“拥抱并扩展”（embrace and extend）吗。特别是，OpenAI 现在暗示你将使用你的 ChatGPT 账户作为将所有这些连接在一起的粘合剂。这就是网络效应！

我对此并不确定：我不确定这个愿景是否真的行得通，如果行得通，我也不确定它是否能赋予一家公司统治地位。

首先，科技界经常出现一种谬误，即你可以将许多不同的复杂产品抽象成一个简单的标准接口——你可以称之为“小组件谬误”（widget fallacy）。十年前，人们说“API 是新的 BD（商务拓展）”，这实际上是同一个概念，而且它基本上失败了。部分原因是，在演示中看起来很酷的东西，与实际产品中交互模型和工作流的所有工作和思考之间存在巨大的鸿沟：你很快就会遇到异常情况，你需要实际的产品 UI 和人类的决策。这也是因为激励机制是不一致的：没有人想成为别人愚蠢的 API 调用，因此，抽象层可能给你的分发渠道（Google 购物、Facebook 购物，以及现在的 ChatGPT 购物）与你控制体验和客户关系的愿望之间存在着固有的紧张关系或权衡。毕竟，别忘了 Instacart 的所有利润都来自展示广告。

当然，这只是猜测——也许这次一切都会奏效！但第二个问题是，如果这些都是通过抽象和自动化的 API 连接在一起的独立系统，那么用户或开发者会被锁定在其中任何一个系统中吗？如果聊天机器人信息流中的应用程序有效，并且 OpenAI 使用一种标准，而 Gemini 使用另一种标准，是什么阻止了开发者同时支持两者？这比同时开发 iOS 和 Android 应用程序所需的代码要少得多，而且无论如何，你难道不能让 AI 为你写代码吗？这对开发者锁定有什么影响？与此同时，是的，也许我会用我的 OpenAI 或 Gemini 账户登录所有这些服务，但我用同一个账户登录 Tinder、Zillow 和 Workday 真的有意义吗？再说一次，他们想要那样吗？

嗯。

在写这篇文章时，我一次又一次地回到平台、生态系统、杠杆和网络效应等词汇上。这些词在科技界被频繁使用，但它们的含义相当模糊。Google Cloud、Apple 的 App Store、Amazon Marketplace，甚至 TikTok 都是“平台”，但它们都截然不同。

也许我真正寻找的词是权力（power）。很久以前我在上大学时，我的中世纪历史教授 Roger Lovatt 告诉我，权力是让人们做他们不想做的事情的能力，而这正是这里的问题所在。OpenAI 是否有能力让消费者、开发者和企业比使用其他任何人的系统更多地使用它的系统，而不管该系统本身实际做什么？Microsoft、Apple 和 Facebook 拥有这种能力。Amazon 也是如此——这是一个真正的飞轮。***

谈到这一点，我认为解读比尔·盖茨那句话的一个好方法是，一个平台真正实现的是利用整个科技界的创造力，这样你就不必自己发明一切，大量的东西会被大规模地构建出来，但是，这一切都是在你的系统上完成的，由你掌控着缰绳。大语言模型（LLMs）具备这一点吗？

基础模型肯定是乘数：大量的新事物将用它们来构建。但是，你是否有理由让每个人都必须使用你的东西，即使你的竞争对手已经构建了同样的东西？是否有理由说明，无论竞争对手投入多少金钱和努力，你的东西将永远比他们更好？这就是整个消费科技行业在我们一生中的运作方式。如果不是这样，那么你拥有的唯一东西就是执行力，每一天的执行力。比其他所有人都执行得更好当然是一种抱负，一些公司在很长一段时间内做到了这一点，甚至说服自己他们已经将其制度化了，但这并不是一种战略。

另一个比较是 ZIRP（零利率政策）时期“资本作为武器”的阶段，当时公司利用廉价资本购买规模，希望这能给他们带来具有网络效应的市场主导地位，从而形成防御壁垒。这至少可以说在 Uber 身上奏效了，但在 WeWork 身上却没有，WeWork 和 OpenAI 一样，没有网络效应。

** 也有可能结果完全不同，（比如说）我们最终会得到大量不同形状和大小的模型，其中一些在边缘端（edge）免费运行，而谈论 AI 基础设施的寡头垄断就像谈论 SQL 基础设施的寡头垄断一样毫无意义。我们只是不知道。

*** 对此的反驳是，Microsoft、Google、Apple 和 Meta 可能生活在一个具有“赢家通吃”效应的世界里，但他们从未认为自己已经赢了。他们总是充满危机感。当然，这种心态的标志性表达是 Andy Grove 的名言“只有偏执狂才能生存”。Intel 曾经拥有网络效应，后来失去了；它曾经拥有技术领先优势，后来也失去了。

wsl-docs

探索

OpenAI 将如何竞争

摘要

正文

关联主题

关系图谱

目录

反向链接