摘要

一句话总结 智谱以MIT协议突发开源了GLM-4.5系列大模型,该模型以较小的参数量实现了开源模型综合性能SOTA,并在代码与智能体能力上表现优异且API定价极低。

关键信息

  • 模型版本与参数:发布了GLM-4.5(总参数355B,激活参数32B)和GLM-4.5-Air(总参数106B,激活参数12B)两款模型。
  • 开源协议:全面开源,采用对商业友好的MIT协议。
  • 性能排名:参数量仅为DeepSeek-R1的1/2、Kimi-K2的1/3,但综合评测达到全球第三、国产第一及开源模型SOTA。
  • 训练过程:基于15万亿token通用数据预训练,叠加8万亿token针对性数据(代码、推理、智能体)训练,最后通过强化学习增强能力。
  • API定价与速度:API调用价格极低(输入0.8元/百万tokens,输出2元/百万tokens),生成速度最高可达100 tokens/秒。
  • 代码与智能体能力:在52个Agentic Coding盲评测试任务中表现为国内最佳,优于Kimi-K2和Qwen3-Coder,在多数场景下可平替Claude-4-Sonnet。
  • 测试透明度:官方将测试题目和Agent轨迹全部公开在HuggingFace上,供外界验证与复现。
  • 用户访问:普通用户目前可以在 z.ai 平台上免费使用该模型。

正文

刚刚,深夜,智谱在没有任何预告的情况下,发了GLM - 4.5。

沉积了很久的智谱,终于有动作了。

https://github.com/zai-org/GLM-4.5

看了一下效果,比之前的GLM-4强的不是一点半点。

大概总结一下:

  1. 发了两个模型,GLM-4.5和GLM-4.5-Air,总参数量分别是355B和106B,但激活参数32B和12B。

  2. 全面开源,MIT协议。

  3. 参数优化的很不错,GLM-4.5参数量是DeepSeek-R1的1/2、Kimi-K2的1/3,但综合评测登顶,全球模型第三、国产模型第一、开源模型SOTA。

  4. 在15万亿token的通用数据上进行了预训练,此后在代码、推理、智能体等领域的8万亿token数据上进行针对性训练,最后通过强化学习进一步增强模型推理、代码与智能体能力。

  5. 定价极其离谱,超级便宜,API调用价格低至输入 0.8 元/百万 tokens,输出 2 元/百万 tokens。

  6. 生成速度最高能达到100tokens/秒。

  7. 在Agentic Coding的盲评测试中,跟Claude-4-Sonnet、Kimi-K2、Qwen3-Coder进行了对比,GLM-4.5在52个编程开发任务上的表现,国内最佳,在大部分场景中可以平替Claude-4-Sonnet,碾压了K2和Qwen3-Coder。

  8. 为了保证透明度,还把测试题目和Agent轨迹全部公开了,放在HuggingFace上供大家验证复现(https://huggingface.co/datasets/zai-org/CC-Bench-trajectories)。这种透明度,在模型厂商里真的少见,非常牛逼且自信。

  9. 综合来看,应该是未来搭配Claude Code的最性价比模型,GLM-4.5+CC可能会成为主流。

  10. 普通用户可以在z.ai上免费用,不要钱。

所有的素材我都放在评论区,这两天忙完手上的事详细测试一下,感觉堆在手上无数的任务。

海外疯狂涨价、国内疯狂开源。

这个生态,也是挺有意思的。

关联主题