摘要
1) 一句话总结 谷歌在一月份全面推进“个性化智能”,通过 Gemini 3 及相关 AI 技术大幅升级了搜索、Chrome、教育工具、视觉模型、视频生成以及零售商业生态等核心产品与服务。
2) 关键要点
- 个性化智能全面接入: Gemini 应用和搜索 AI 模式现可安全连接 Gmail、Google Photos 等应用提供专属回复(美国 Beta 版);Gmail 免费提供“帮我写”及 AI 概览功能。
- Chrome 浏览器重大升级: 搭载 Gemini 3,推出可代办复杂多步骤任务的“自动浏览”功能,并支持使用 Nano Banana 转换网页图像。
- 教育与学习资源扩展: 联合可汗学院与牛津大学提供 AI 工具;Gemini 应用新增免费的 SAT 和 JEE Main 完整模拟考试;部分 Gemini in Workspace 功能向教育核心版免费开放。
- 搜索 AI 概览进化: Gemini 3 成为全球 AI 概览的默认模型,支持用户直接提出后续问题并进行对话式互动。
- 视觉模型能力提升: Gemini 3 Flash 引入“代理视觉”(Agentic Vision),使模型从被动观察转为主动探索图像细节,提升了视觉基准测试的质量。
- 创意与视频工具更新: Veo 3.1 支持原生垂直输出及 1080p/4K 分辨率提升;AI 世界模型 Genie 3 向美国 18 岁以上的 Google AI Ultra 订阅用户开放。
- 零售与商业生态布局: 在 NRF 2026 展会上推出通用商业协议(UCP),支持在搜索 AI 模式和 Gemini 中直接结账;Wing 与沃尔玛的无人机配送范围扩大至超 4000 万美国人。
3) 风险与不足
- AI 视觉“幻觉”问题: 传统的 AI 模型在处理过小或模糊的图像细节时容易进行猜测,从而产生“幻觉”(谷歌正通过引入“代理视觉”技术来解决此问题)。
- 教育数据安全风险: 在将 AI 引入教育领域的过程中存在数据保护需求(谷歌为此发布了新的安全和 AI 检测功能以保护教育机构的数据)。
正文
20多年来,我们持续投资于机器学习和AI研究、工具及基础设施,致力于打造让更多人日常生活更美好的产品。为了让大家及时了解我们的进展,我们将定期回顾谷歌最新的AI动态。以下是我们一月份发布的重要AI新闻回顾。
迈向个性化智能新纪元
一月份,我们将AI推向了“个性化智能”(Personal Intelligence)的新纪元,让搜索、Chrome和Gemini应用等产品变得前所未有地主动。无论是Chrome的“自动浏览”代您处理繁杂事务,还是Gmail为您呈现最重要的事情,这些全新的个性化功能都旨在预测您的需求、理解您的背景并帮助您完成任务。
- Gemini 应用引入个性化智能: 您现在可以安全地连接Gmail、Google Photos、YouTube和Search等谷歌应用,让Gemini为您提供专属帮助。个性化智能目前已在美国推出Beta版,并很快将登陆更多国家。该功能需用户主动开启,您可以自由指定允许其访问的应用。
- 搜索 AI 模式(AI Mode)升级: 个性化智能已登陆搜索的AI模式。Google AI Pro和Ultra订阅用户可以安全地选择接入Gmail和Google Photos等应用,获取量身定制的回复,包括购物和旅行等建议。
- Gmail 迈入 Gemini 时代: “帮我写”(Help me write)、AI概览和个性化建议回复等AI工具现已在Gmail免费提供。Google One AI Ultra和Pro订阅用户还可使用Gmail搜索中的AI概览,以及用于高级语法、语气和风格检查的校对功能。此外,我们向部分受信任的测试人员推出了“AI收件箱”(AI Inbox),帮助用户过滤杂音,聚焦最重要的邮件。
- Chrome 浏览器搭载 Gemini 3: Chrome迎来了基于Gemini 3的重大更新,其中包括突破性的“自动浏览”(auto browse)功能,可完全代您处理预订旅行或安排日程等复杂的多步骤任务。此外,Chrome现在支持使用Nano Banana在网页上转换图像,全新的侧边栏也让多任务处理变得更加轻松。
打造更个性化的学习与教育体验
- 全新学习与教育工具: 在伦敦BETT教育科技展上,我们宣布与可汗学院(Khan Academy)合作,通过Gemini驱动一系列读写工具;并与牛津大学合作,向所有师生提供Gemini和NotebookLM。我们还发布了Google Classroom、ChromeOS的更新,以及新的安全和AI检测功能,以保护教育机构的数据。
- Gemini 应用新增模拟考试功能: 通过与Princeton Review、Careers360和Physics Wallah合作,Gemini应用现在提供免费的完整SAT和JEE Main模拟考试。学生可以获得即时反馈,让Gemini解释答案,并创建定制的学习计划。
- 普及高级 Google AI 功能: 我们将部分Gemini in Workspace功能免费引入Google Workspace for Education核心版本。这意味着更多师生可以在Docs、Slides等日常应用中使用Gemini。此外,Google Workspace Studio也作为核心服务推出,用于设计和分享AI智能体。
让探索复杂信息变得毫不费力
- 无缝探索信息的全新搜索体验: 搜索功能持续进化,无论问题多么复杂,都能让您轻松找到所需内容。Gemini 3现已成为全球AI概览(AI Overviews)的默认模型,在搜索结果页直接提供一流的AI回复。此外,您现在可以直接在AI概览中提出后续问题,并与AI模式进行对话式互动。
为开发者带来更强大的视觉模型
- Gemini 3 Flash 引入代理视觉(Agentic Vision): 传统的AI模型通常以单一的静态快照处理图像,如果细节过小或模糊,AI就会进行猜测,这往往是产生“幻觉”的原因。现在,代理视觉将Gemini 3 Flash从被动观察者转变为主动调查者。模型不再只是“看”,而是会主动“探索”,从而在大多数视觉基准测试中实现了质量的稳定提升。该功能现已通过Google AI Studio和Vertex AI的Gemini API提供,并正在向Gemini应用推送。
助力将创意愿景化为现实
- Veo 3.1 更新: 最新更新为休闲创作者和专业电影制作人提供了更高的一致性、创造力和控制力。生成的视频拥有更丰富的对话,支持YouTube Shorts等平台的原生垂直输出,并可将分辨率提升至1080p或4K。
- 圣丹斯电影节首映《亲爱的楼上邻居》: 这部由Google DeepMind动画师和研究团队使用AI创作的短片,讲述了一位被吵闹邻居吵得无法入睡的年轻女性的故事。该片使用视频到视频(video-to-video)技术,将动画与抽象表现主义进行了融合。
- 开放 AI 世界模型 Genie 3: 我们的实验性研究原型Project Genie现已向美国18岁以上的Google AI Ultra订阅用户开放。在Genie 3的驱动下,用户可以创建、探索和重组自己的互动世界。自8月首次亮相以来,Genie 3通用世界模型已帮助测试者发现了设计和探索数字环境的全新方式。
- Google Arts & Culture 推出实验性旅行功能: 全新的“城市指南”(City Guides)和“漫画明信片”(Comic Postcards)旨在激发您的想象力。城市指南会根据您的兴趣和日程安排推荐地标和现场活动;而漫画明信片则利用生成式AI,让您直接置身于自己专属的插画冒险中。
助力零售商在 AI 平台转型中实现增长
- NRF 2026 上的全新 AI 技术与工具: 在2026年美国全国零售商联合会(NRF)展会上,我们的CEO Sundar Pichai探讨了AI平台的转型,并推出了一系列帮助零售商抓住机遇的新工具。其中最引人注目的是通用商业协议(UCP)。这一全新的代理商业开放标准支持从发现到购买的无缝购物体验,并允许直接在搜索的AI模式和Gemini应用中完成结账。此外,随着Gemini Enterprise的发布,Sundar还宣布Wing和沃尔玛正在扩大无人机配送范围,以覆盖超过4000万美国人。正如Sundar所言:“我们的目标是构建一个零售业的未来,让每个人的机会空间都得到拓展。”
相关文档
- 动画师与AI研究员如何携手打造《亲爱的楼上邻居》;关联理由:同一事件;说明:本文在创意章节提到该短片首映,这篇文档提供了该案例的独立背景与制作细节。
- Gemini 3 Deep Think:推动科学、研究与工程的进步;关联理由:版本演进;说明:本文总结 Gemini 3 在多产品线的落地,该文可补充同代模型能力升级的技术脉络。
- Project Genie:探索无限的交互式世界;关联理由:同一事件;说明:本文在一月动态中提到 Genie 3 向订阅用户开放,该文对产品能力与已知限制做了完整展开。
- 随便问:无缝衔接的全新搜索体验;关联理由:解说;说明:本文概述了搜索 AI 概览和 AI 模式升级,该文可补充这项搜索侧更新的细节与使用语境。