摘要
1) 一句话总结 谷歌正式发布首次采用小版本号迭代的 Gemini 3.1 Pro 模型,其推理性能较上一代翻倍,多模态与复杂任务处理能力显著增强,并在保持原有定价的基础上大幅提升了性价比。
2) 核心要点
- 版本与上线情况:谷歌首次采用「.1」版本号,目前已在 Gemini 应用、API 上线,Google AI Pro 和 Ultra 用户可在 NotebookLM 中体验。
- 核心参数:支持 1M 上下文窗口,知识库截止日期为 2025 年 1 月。
- 推理性能翻倍:在 ARC-AGI-2 基准测试中获得 77.1% 的分数(推理表现达 3 Pro 的 2 倍);在 Arena 评测中整体得分比 3 Pro 高出 13 分,文本与代码能力进步明显。
- 多模态与生成能力提升:数据可视化、复杂场景生成(如地形与交通线路)、动作连贯性及色彩输出均有跃升,支持直接生成带交互和动态音乐的 3D 视觉代码。
- API 定价维持不变:API 价格与 Gemini 3 Pro Preview 持平,输入价格为 2美元(<200k tokens)/ 4美元(>200k tokens),输出价格为 4美元(<200k tokens)/ 18美元(>200k tokens)。
- 智能成本大幅下降:完成一次 ARC-AGI-2 任务仅需 0.96 美元;与价格高出 10 倍的 Gemini 3 Deep Think 相比,3.1 Pro 的性能差距仅有几个百分点,打破了传统的“成本-智能曲线”。
正文
春节档国产大模型狂卷之际,谷歌也突然出手,深夜放出大招——正式发布 Gemini 3.1 Pro。相较于去年11月才刚刚发布的 3 Pro,这次虽然只是「.1」的一小步迭代,但升级幅度肉眼可见。
多模态与可视化能力的全面跃升
在官方给出的对比展示中,3.1 Pro在多模态生成和语义理解上都提升了一个层级:
- 数据可视化:能将日常数据转化为互动可视化内容,轻松生成航空航天仪表盘。
- 复杂场景生成:玩起「模拟城市」来,地形生成、道路铺设、交通线路一整套直接成型。
- 动作与色彩:在同一提示词下,3.1 Pro在动作连贯性和色彩输出上较上一代有明显提升。
核心推理能力大幅进化
此次升级公开了上周发布的 Gemini 3 Deep Think 背后的核心智能。在 Gemini 3 的基础上,3.1 Pro 在核心推理能力上更进一步:
- 基准测试表现:在 ARC-AGI-2 基准测试中,3.1 Pro 获得了 77.1% 的验证分数,推理表现达到 3 Pro 的 2倍 之多。在 Arena 的对比评测中,整体排名分数比 3 Pro 高出 13分,文本与代码维度的进步相当明显。
- 模型参数与特性:支持 1M 上下文,知识截止日期为 2025年1月。在多模态理解能力、vibe coding、多语言性能和长上下文方面同步增强。
- 复杂任务处理:能应对结构更复杂、步骤更多的提示词需求。例如,直接生成3D版“椋鸟群飞”视觉代码,一次到位并附带可交互玩法(支持手势追踪操控鸟群,画面还能根据鸟群运动变化生成音乐)。
网友实测与上线情况
网友们在第一时间对模型进行了检验,效果令人惊艳:
- 直接生成《我的世界》(Minecraft)游戏场景。
- 手搓个人网站,视觉效果甚至被评价为超越官网。
- 开发教育应用,模拟光线效果极其逼真。
一圈体验下来,网友们纷纷感叹“其他家模型可以直接over了”,并表示谷歌这次“没有在开玩笑”。
目前,Gemini 3.1 Pro 已在 Gemini 应用和 API 中上线,Google AI Pro 和 Ultra 用户也可以在 NotebookLM 中体验这一最新模型。
智能成本呈数量级下降
这是谷歌首次采用「.1」这样的小版本号。有网友惊讶于 Gemini 3 Pro 还在 Preview 阶段就推出了新模型,这也预示着大模型的2026年注定竞争激烈。
值得注意的是,谷歌这一步将大模型进一步推向了“帕累托前沿”(Pareto Front),即在最小化成本的同时最大化性能:
- API定价:输入价格为 2美元(<200k tokens)/ 4美元(>200k tokens);输出价格为 4美元(<200k tokens)/ 18美元(>200k tokens),与 Gemini 3 Pro Preview 持平。
- 任务成本:从 ARC-AGI 基准的视角来看,完成一次 ARC-AGI-2 任务仅需花费 0.96美元。
- 性价比对比:Gemini 3 Deep Think 的价格是 3.1 Pro 的 10倍,但两者性能相差仅几个百分点。
这种推进速度完全打破了传统的“成本-智能曲线”。相比于基准榜单上的成绩变化,对于高速进化的大模型应用而言,成本的持续压缩更加值得关注。而2026年的大模型之战,这才刚刚开始。