刚刚智谱突然开源了GLM-4.5，实现综合SOTA。

摘要

一句话总结 智谱以MIT协议突发开源了GLM-4.5系列大模型，该模型以较小的参数量实现了开源模型综合性能SOTA，并在代码与智能体能力上表现优异且API定价极低。

关键信息

模型版本与参数：发布了GLM-4.5（总参数355B，激活参数32B）和GLM-4.5-Air（总参数106B，激活参数12B）两款模型。
开源协议：全面开源，采用对商业友好的MIT协议。
性能排名：参数量仅为DeepSeek-R1的1/2、Kimi-K2的1/3，但综合评测达到全球第三、国产第一及开源模型SOTA。
训练过程：基于15万亿token通用数据预训练，叠加8万亿token针对性数据（代码、推理、智能体）训练，最后通过强化学习增强能力。
API定价与速度：API调用价格极低（输入0.8元/百万tokens，输出2元/百万tokens），生成速度最高可达100 tokens/秒。
代码与智能体能力：在52个Agentic Coding盲评测试任务中表现为国内最佳，优于Kimi-K2和Qwen3-Coder，在多数场景下可平替Claude-4-Sonnet。
测试透明度：官方将测试题目和Agent轨迹全部公开在HuggingFace上，供外界验证与复现。
用户访问：普通用户目前可以在 z.ai 平台上免费使用该模型。

刚刚，深夜，智谱在没有任何预告的情况下，发了GLM - 4.5。

沉积了很久的智谱，终于有动作了。

看了一下效果，比之前的GLM-4强的不是一点半点。

大概总结一下：

发了两个模型，GLM-4.5和GLM-4.5-Air，总参数量分别是355B和106B，但激活参数32B和12B。
全面开源，MIT协议。
参数优化的很不错，GLM-4.5参数量是DeepSeek-R1的1/2、Kimi-K2的1/3，但综合评测登顶，全球模型第三、国产模型第一、开源模型SOTA。
在15万亿token的通用数据上进行了预训练，此后在代码、推理、智能体等领域的8万亿token数据上进行针对性训练，最后通过强化学习进一步增强模型推理、代码与智能体能力。
定价极其离谱，超级便宜，API调用价格低至输入 0.8 元/百万 tokens，输出 2 元/百万 tokens。
生成速度最高能达到100tokens/秒。
在Agentic Coding的盲评测试中，跟Claude-4-Sonnet、Kimi-K2、Qwen3-Coder进行了对比，GLM-4.5在52个编程开发任务上的表现，国内最佳，在大部分场景中可以平替Claude-4-Sonnet，碾压了K2和Qwen3-Coder。
为了保证透明度，还把测试题目和Agent轨迹全部公开了，放在HuggingFace上供大家验证复现（https://huggingface.co/datasets/zai-org/CC-Bench-trajectories）。这种透明度，在模型厂商里真的少见，非常牛逼且自信。
综合来看，应该是未来搭配Claude Code的最性价比模型，GLM-4.5+CC可能会成为主流。
普通用户可以在z.ai上免费用，不要钱。

所有的素材我都放在评论区，这两天忙完手上的事详细测试一下，感觉堆在手上无数的任务。

海外疯狂涨价、国内疯狂开源。

这个生态，也是挺有意思的。