摘要
一句话总结 谷歌发布了定价极具竞争力且 SVG 动画生成能力显著提升的 Gemini 3.1 Pro 模型,并推出了优化工具调用的自定义版本,但发布初期存在响应缓慢和高并发报错的问题。
关键要点
- 定价策略:价格与 Gemini 3 Pro 保持一致(20 万 Token 以内:输入 2 美元/百万 Token,输出 12 美元/百万 Token;20 万至 100 万 Token:输入 4 美元/百万 Token,输出 18 美元/百万 Token)。
- 竞品对比:价格不到 Claude Opus 4.6 的一半,但两者的基准测试得分非常接近。
- SVG 生成能力:相较于旧版,SVG 动画生成性能显著提升,能够生成包含丰富细节(如车架两侧的腿、篮子里的鱼)以及带有代码注释的复杂图像。
- 官方演示:谷歌 Gemini 负责人 Jeff Dean 通过视频展示了该模型生成多种“动物驾驶交通工具”的 SVG 动画,直观展示了新模型独有的能力。
- 新增模型版本:推出了
gemini-3.1-pro-preview和gemini-3.1-pro-preview-customtools,官方称后者在某些情况下能提供更好的工具调用性能。 - 系列背景:上周发布的 Gemini 3 Deep Think 是 3.1 系列的首次亮相,而本次发布的 Gemini 3.1 Pro 是其背后的“升级版核心智能”。
风险与不足
- 响应速度极慢:发布初期模型响应迟缓,例如回复简单的“hi”耗时 104 秒,生成 SVG 提示词的思考时间长达 323.9 秒。
- 高并发报错:在测试过程中会遇到“模型当前需求量大”或“操作完成前已过截止时间”的错误提示。
正文
Gemini 3.1 Pro 是 Gemini 3.1 系列的首款模型。它的定价与 Gemini 3 Pro 保持一致(在 20 万 Token 以内,输入为 2 美元/百万 Token,输出为 12 美元/百万 Token;20 万至 100 万 Token 之间则为 4 美元/18 美元)。这一价格还不到 Claude Opus 4.6 的一半,但两者的基准测试得分却非常接近。
令人惊艳的 SVG 动画生成能力
在发布公告中,谷歌特别强调了该模型相较于 Gemini 3 Pro 在 SVG 动画性能上的显著提升。
我在 Google AI Studio 中尝试了提示词:“生成一只骑自行车的鹈鹕的 SVG”。模型思考了 323.9 秒后给出了结果。画面中清晰地描绘了车架两侧的腿,篮子里的鱼也是一个很棒的细节,而且我也很欣赏它在 SVG 代码中留下的注释。
去年 11 月我曾说过:“如果终于有一款模型能生成极好的‘鹈鹕骑自行车’的 SVG,我一定会测试它生成各种生物驾驶各种交通工具的效果。”
有趣的是,谷歌 Gemini 负责人 Jeff Dean 在推特上发布了一段视频,里面不仅有骑自行车的动画鹈鹕,还有骑着大小轮自行车(penny-farthing)的青蛙、开着微型汽车的长颈鹿、穿着旱冰鞋的鸵鸟、玩滑板的乌龟,以及开着加长豪华轿车的腊肠犬。我一直希望 AI 实验室能重点展示新模型能做到、而旧模型做不到的事情,Gemini 团队的这段视频绝对值得给满分。随后,我也使用自己的插件运行了更详细的鹈鹕提示词,并得到了包含 SVG 注释的良好结果。
插件更新与自定义工具模型
我已经将两个新的模型 ID(gemini-3.1-pro-preview 和 gemini-3.1-pro-preview-customtools)添加到了我的 llm-gemini 插件中。据官方描述,在某些情况下,带有“custom tools”的模型可能会提供比默认模型更好的工具调用性能。
发布初期的响应速度与背景
目前该模型的响应速度非常慢——回复一个简单的“hi”就花了 104 秒。我的其他几个测试也遇到了“模型当前需求量大,需求激增通常是暂时的”或“操作完成前已过截止时间”的错误。我猜测这只是发布首日的初期磨合问题。
从官方消息来看,上周发布的 Gemini 3 Deep Think 其实是我们首次接触 3.1 系列。正如谷歌所说,上周的 Deep Think 旨在解决科学、研究和工程领域的现代挑战,而今天发布的 Gemini 3.1 Pro 则是实现这些突破的“升级版核心智能”。
相关文档
- Gemini 3 Deep Think:推动科学、研究与工程的进步;关联理由:版本演进;说明:本文明确指出 3.1 Pro 承接上周发布的 Deep Think,可补齐 Gemini 3.1 系列的发布脉络。
- 代码界新王登基!Gemini 3.1 Pro 血洗 Claude 与 GPT,12 项基准测试第一!;关联理由:同一事件;说明:两文都围绕 Gemini 3.1 Pro 发布展开,该文补充了基准与上线范围等媒体侧信息。