摘要
1) 一句话总结 自2025年“DeepSeek时刻”以来,全面开源已成为中国AI机构的主流战略,推动了以工程效率、底层算力基础设施和大规模产业部署(“人工智能+”)为核心的有机AI生态系统的形成。
2) 关键要点
- 开源成为默认战略:中国AI机构正全面开源模型、论文和部署基础设施,开源已从“可选项”转变为系统设计的“默认前提”,核心目标是实现大规模部署与整合。
- 阿里巴巴的生态主导:Qwen被定位为通用AI基座。截至2025年中期,Qwen在Hugging Face上的衍生模型超过11.3万个,相关仓库超20万个,远超Meta Llama和DeepSeek。
- 科技巨头的全面入局:腾讯加速了视觉和视频等领域的开源(Tencent HY);字节跳动开源了UI-TARS-1.5等高价值组件,其应用“豆包”在2025年12月DAU破1亿;百度转向开源(Ernie 4.5系列)并重新投资飞桨框架与昆仑芯(宣布2026年IPO)。
- 初创与应用企业的爆发:智谱AI和MiniMax发布先进开源模型并计划IPO,月之暗面(Kimi K2)融资约5亿美元;小红书、B站等应用型企业开始训练并发布自有模型,以降低成本并针对垂直业务进行微调。
- 研究机构夯实基建:智源研究院和上海人工智能实验室等机构不再盲目追求单一模型性能,而是将重心转向工具链、评估系统和数据平台(如FlagOpen、OpenCompass)。
- 算力与硬件基础:截至2025年,中国总算力规模约1590 EFLOPS,智能算力同比增长约43%,数据中心平均PUE降至1.46,形成了以“东数西算”为核心的全国一体化算力布局。
- “人工智能+”政策转向:2025年8月的“人工智能+”行动计划将重心从单纯追求AGI转向大规模部署,推动AI深度嵌入工业流程(向智能体和工作流演进),并强调自主可控的本地化部署。
3) 风险与缺口(基于原文明确提及)
- 算力、成本与监管约束:企业在模型开发和部署过程中面临算力、成本和监管的共同约束(这促使百度等企业通过开源和软硬件整合来降低成本和保持控制力)。
- 能源容量压力:随着智能算力的大规模增长,能源成为关键的关注点,需要持续投资以提升能源容量来支撑大规模AI应用。
- 外部供应商依赖风险:应用型企业如果仅依赖外部闭源模型,会受制于外部供应商的成本结构或使用限制。
- 宏观资源约束:中国AI生态系统的发展面临整体的资源约束(尽管原文指出这种约束反而重塑了行业轨迹,促成了更务实、更具机理结构的生态)。
正文
本文是探讨自2025年1月“DeepSeek时刻”以来,中国开源社区历史性进展系列文章的第三篇(也是最后一篇)。
在本文中,我们将审视中国知名AI机构的发展路径与轨迹,并对开源的未来发展方向提出设想。对于参与和依赖开源生态的AI研究人员与开发者,以及需要了解这一快速变化环境的政策制定者而言,一个明确的趋势是:得益于组织内部和全球社区的共同收益,在可预见的未来,开源已成为中国AI机构的主流和首选策略。从模型、论文到部署基础设施的全面开源共享,其核心战略目标在于实现大规模的部署与整合。
中国有机开源AI生态的形成
在审视了自DeepSeek R1发布以来的战略与架构变化后,我们首次窥见一个有机的开源AI生态系统正在中国成型。无论是老牌开源巨头、新兴力量,还是彻底转变路线拥抱全新开源文化的企业,这些强大参与者的汇聚共同表明:开放协作的模式是互利共赢的。
这种协作正在跨越国界。在Hugging Face平台上,关注度最高的机构是DeepSeek,排名第四的是Qwen(通义千问)。除了开源模型,公开分享科学研究和技术不仅为其他AI机构提供了参考,也惠及了整个开源社区。Hugging Face上最受欢迎的论文主要来自中国机构,特别是字节跳动、DeepSeek、腾讯和Qwen。
老牌科技巨头的战略布局
- 阿里巴巴(Alibaba): 将开源定位为生态系统和基础设施战略。Qwen并未被塑造成单一的旗舰模型,而是不断扩展为一个涵盖多种规模、任务和模态的模型家族,并在Hugging Face及其自有平台ModelScope上频繁更新。它的影响力不局限于任何单一版本,而是作为组件在不同场景中被反复复用,逐渐扮演起通用AI基座的角色。到2025年中期,Qwen成为Hugging Face上衍生品最多的模型,超过11.3万个模型以Qwen为基础,超过20万个模型仓库打上了Qwen的标签,远超Meta Llama的2.7万和DeepSeek的6千。从整个机构来看,阿里巴巴拥有的衍生模型数量几乎与谷歌和Meta的总和相当。同时,阿里巴巴将模型开发与云及硬件基础设施对齐,将模型、芯片、平台和应用整合到了单一的工程栈中。
- 腾讯(Tencent): 完成了从“借用”到“自建”的重大转变。作为R1发布后首批将DeepSeek整合进核心消费级产品的大厂之一,腾讯最初并未将开源作为公开叙事。相反,它通过插件式的整合引入成熟模型,进行大规模内部验证,随后才开始发布自有能力。从2025年5月起,腾讯加速了在其具备优势的领域(如视觉、视频和3D)的开源步伐,推出了自有品牌“腾讯混元”(现为Tencent HY),这些模型迅速在社区中获得采用。
- 字节跳动(ByteDance): 遵循其“AI应用工厂”的模式,开始有选择地开源高价值组件,同时将竞争焦点保持在产品入口和大规模使用上。在此背景下,字节跳动Seed团队贡献了几个引人注目的开源项目,包括用于多模态UI理解的UI-TARS-1.5、以数据为中心的代码模型Seed-Coder,以及用于系统性推理评估的SuperGPQA数据集。尽管在开源领域的姿态相对低调,字节跳动在中国AI市场取得了巨大的规模效应,其AI应用**豆包(Doubao)**在2025年12月的日活用户(DAU)突破了1亿。
- 百度(Baidu): 发生了最显著的转变。尽管其CEO曾公开看衰开源,但百度在多年优先发展闭源模型后,也开始通过免费访问和开源发布(如Ernie 4.5系列)重新进入该生态。伴随这一转变的是对其开源框架**飞桨(PaddlePaddle)以及自有AI芯片昆仑芯(Kunlunxin)**的重新投资(昆仑芯于2026年1月1日宣布IPO)。通过在更开放的系统中连接模型、芯片和飞桨,百度能够在算力、成本和监管的共同约束下,降低成本、吸引开发者、影响行业标准,同时保持战略控制力。
“DeepSeek时刻”的常态化
在初创企业中,月之暗面(Moonshot)、智谱AI(Z.ai)和MiniMax在R1发布后的几个月内迅速调整,为开源社区注入了新动力。Kimi K2、GLM-4.5和MiniMax M2等模型均在AI-World的开源模型里程碑排行榜上占据了一席之地。2025年底,智谱AI和MiniMax发布了迄今为止最先进的开源模型,并紧接着宣布了IPO计划。
Kimi K2的开源被社区广泛称为“又一个DeepSeek时刻”。尽管月之暗面尚未宣布IPO,但市场报告显示,该公司在2025年底筹集了约5亿美元资金,并将AGI和基于智能体(Agent)的系统定位为其主要商业化目标。
那些应用优先型企业,如小红书、哔哩哔哩(Bilibili)、小米和美团,此前仅专注于应用层,现在也开始训练并发布自有模型。凭借在真实使用场景和垂直领域数据上的原生优势,一旦通过开源能够以低成本获得强大的推理能力,构建内部模型就变得切实可行。这使得它们能够围绕特定业务微调AI,而不必受制于外部供应商的成本结构或限制。
如果说商业界抓住了这一提升投资回报率(ROI)的增长机遇,那么研究机构和更广泛的社区则更加积极地拥抱了这一转变。智源研究院(BAAI)和上海人工智能实验室等机构将更多精力转向工具链、评估系统、数据平台和部署基础设施,推出了如FlagOpen、OpenDataLab和OpenCompass等项目。这些努力不再盲目追求单一模型的性能,而是致力于夯实生态系统的长期基础。
筑基未来:从算力到“人工智能+”
新生态系统的决定性特征不在于模型数量的增加,而在于形成了一条完整的产业链:模型可以被开源和扩展;部署方案可以被复用和扩展;软硬件可以协同和替换;治理能力可以被嵌入和审计。这标志着从孤立的技术突破,向能够在现实世界中实际运行的系统转变。
这种生态系统并非一蹴而就。它建立在自2017年以来多年积累的基础设施“顺风”之上。**过去几年里,中国持续投资数据中心和智算中心,逐步形成了以“东数西算”战略为核心的全国一体化算力布局。**国家规划设立了8大算力枢纽和10个数据中心集群,引导东部的算力需求向中西部转移。
公开信息显示,中国正计划持续投资以提升能源容量。截至2025年,中国总算力规模约为1590 EFLOPS,位居全球前列。国内消息指出,专为AI训练和部署量身定制的智能算力预计将实现约43%的同比增长,远超通用算力的增速。同时,数据中心平均电能利用效率(PUE)降至1.46左右,表明能效提升,为大规模AI应用提供了坚实的硬件基础。能源显然是关键的关注点。
如果说2017年的《新一代人工智能发展规划》主要是指明方向和打基础,那么2025年8月的“人工智能+”行动计划则明确将重心转向了大规模部署和深度融合。这标志着与单纯追求AGI在方向上的不同。 R1的出现提供了工程和生态系统层面缺失的“升力”,它作为催化剂,系统性地激活了已经建成的算力、能源和数据基础设施。
因此,在R1发布后的一年里,中国AI的发展沿着两条主线加速:
- AI更深地嵌入工业流程,超越了聊天机器人的范畴,向智能体(Agents)和工作流演进。
- 更加强调自主可控的AI系统,这体现在更灵活的训练路径和日益本地化的部署策略上。
回过头来看,真正的转折点不是模型数量的增长,而是开源模型使用方式的根本性改变。开源从一种“可选项”变成了系统设计中的“默认前提”。模型成为了大型工程系统中可复用、可组合的组件。
总结与展望
从DeepSeek到“人工智能+”,中国在2025年的道路并非一味追求性能巅峰,而是围绕开源、工程效率和可扩展交付,构建了一条务实的发展路径,并且这条路径已经开始自主运转。
资源约束并没有限制中国AI的发展,在某些方面,它反而重塑了发展轨迹。DeepSeek R1的发布作为一个催化事件,引发了国内行业的连锁反应,加速了一个更具机理结构的生态系统的形成。同时,这一转变也为国内持续的研发创造了关键的窗口期。随着该生态系统的成熟,其长远影响——以及全球AI社区将如何与中国这个日益自给自足的AI生态系统互动——将成为未来讨论的重要课题。