wsl-docs

❯

❯

gemini

2026年3月11日3分钟阅读

定义

用于聚合 Gemini 相关文档。Gemini 是由 Google 开发的原生多模态大语言模型系列，具备跨越文本、图像、音频、视频和代码等多种信息载体的理解与生成能力。

核心内涵

原生多模态：从底层架构开始即采用多模态数据进行联合训练，而非通过拼接不同单模态模型来实现，从而具备更深度的跨模态推理能力。
弹性架构：包含不同参数规模的版本（如 Nano, Flash, Pro, Ultra），以适应从端侧设备到云端数据中心的差异化算力需求。
长上下文处理：支持超大规模的上下文窗口，能够一次性摄入并分析长篇文档、代码库或长视频内容。
复杂推理：在数学解题、逻辑推演、代码编写及跨模态信息提取方面展现出强大的泛化与涌现能力。

实践要点

多模态提示词设计：在构建 Prompt 时，合理组合文本指令与多媒体素材，明确指定输出格式与跨模态关联逻辑。
上下文管理：充分利用长上下文优势处理复杂任务，但需注意信息检索的准确性及 API 调用的成本控制。
端云协同：根据业务场景的延迟与隐私要求，灵活选择端侧轻量级模型或云端高性能模型进行部署。
安全与合规：遵循平台的使用规范，利用内置的安全过滤器防范有害内容生成，并注意处理多模态数据时的隐私保护。

相关词条

llm
AI
prompt
video

关联主题

AI
llm
multimodal
prompt
workflow
audio
video
compliance
security

关系图谱

定义
核心内涵
实践要点
相关词条
关联主题

反向链接

四种奇异吸引子及其公式
智能体时代的 AI 使用指南
Google DeepMind 助力美国能源部“创世纪”计划：加速科学创新与发现
使用 Gemini Deep Think 加速数学与科学发现
借助AI驱动的科学与教育，加速印度的创新与发现
加强与英国政府的合作：在AI时代共筑繁荣与安全
扩大新加坡业务版图：推动亚太地区人工智能发展
2026年AI影响力峰会：我们如何通过合作让AI惠及所有人
AI工具如何重塑通用设计以提升无障碍体验
Circle to Search 更新：从全局识别到穿搭检索
Gemini 3 Deep Think：推动科学、研究与工程的进步
Google AI Plus 扩展至包括美国在内的 35 个新国家和地区
Google DeepMind 升级 Game Arena：用狼人杀与德州扑克推进 AI 基准测试
Google 与马萨诸塞州 AI 中心正在为该州推出一项新的 AI 培训计划。
Google：用游戏推进 AI 基准测试
Project Genie：探索无限的交互式世界
三星 Galaxy S26 上的更智能 Android
借助 Translate 中由 AI 驱动的全新更新，获取更多上下文并更深入地理解翻译。
全新表达方式：Gemini 现在可以创作音乐了
原生自适应界面：AI 无障碍设计的新框架
在“安全互联网日”助力青少年在线学习与成长
尝试向 Google Photos 提问的 9 个有趣问题
探索与创造：全新 Gemini 广告亮相橄榄球重大周末
教会AI看地图
谷歌一月 AI 动态回顾：迈向个性化智能新纪元
谷歌云 AI 助力美国滑雪队提升竞技技巧
随便问：无缝衔接的全新搜索体验
代码界新王登基！Gemini 3.1 Pro 血洗 Claude 与 GPT，12 项基准测试第一！
揭秘 Google DeepMind 运作模式：重塑现代版贝尔实验室，谷歌的棋局有多大？
LangSmith 正式上线 Google Cloud Marketplace
AI正在重塑全球顶尖围棋选手的思维方式
GPT-5.2 评测：令人惊艳，但速度太慢
我的 GPT-5 评测 —— Vibe Coding 进阶为真正的软件
我的 GPT-5.1 Pro 评测
我的 GPT-5.3-Codex 评测：完全自主已经到来
我的 Gemini 3 评测
谷歌突发Gemini 3.1 Pro：首次采用「.1」版本号，推理性能翻倍
Google API 密钥本非秘密，但 Gemini 改变了规则
SWE-bench 2026年2月排行榜更新与模型表现
谷歌发布 Gemini 3.1 Pro：极具竞争力的定价与出色的 SVG 生成能力
使用 Gemini 检测并编辑视觉对象
保姆级教程：超前体验 Gemini3 和 Nano Banana Pro
2025年末全球 AI 行业流量报告：狂热退潮，分化开始
AI 2025-2026 众包调研年终总结:从「聊天」到「干活」的范式转变
Prompt to build a "Retro Camera Web App" by Gemini 3
Gemini Coding partner System Prompt
Gemini 引导式学习系统提示词
Gemini Guided Learning System Prompt
Google Firebase Studio 使用初体验
Google NotebookLM 系统提示词
Google 官方提示工程 (Prompt Engineering)白皮书
Jeff Dean 深度访谈：一页纸备忘录促成 Gemini 的诞生，Google AI 的反击与 10,000 Token 的未来
System prompt of NotebookLM Infographic
OpenAI 智能体工程指南：10 条实战技巧和 3 种构建模式
PC 软件为手机重做了一遍，现在轮到 Agent 了
Prompt：Transcribes YouTube videos (from a URL) or uploaded local videos into a structured, formatted text complete with speaker labels and timestamps
ReAct 框架与 AI Agent：当 AI 学会自己思考和行动
Skill 不就是长一点的提示词吗？
Stack Overflow 2025 年度报告：写代码如果不值钱了，我们该去哪？
Summarize YouTube Video Prompt
YouTube Video -> Blog Post Prompt (Gemini Only)
“学术论文科普”提示词，把枯燥的学术论文变成通俗易懂的科普文
一些我用 AI 翻译文章的心得
一句话提示词，让 AI 帮你总结整理论坛的讨论帖子
为什么Cursor中有的问题解决不了，反而Claude 能给出更好的代码？
使用 Cursor 编程的一些建议
喜欢看 arxiv 上论文的朋友推荐使用 alphaxiv 这个网站看论文，官方出品，集成了 AI 功能还免费
在画了几百张 nano banana pro 图片收获了几百万流量之后的一些提示词写作经验
大语言模型高考数学拿高分靠强化学习，那文科考高分得靠什么？
如何使用 Gemini 把播客转成格式良好文本
如何给知识类文章画信息图风格的配图
如果没有编程基础，但是如何能做一个像grammar那种可以实时进行语法修正的ai软件？
将文章、故事变成漫画脚本提示词参考
小红书视觉内容策划师提示词
我写了个 Skill，让 Agent 自动给文章配图
我日常 AI 辅助编程的模型和工具搭配
我是如何高效翻译 65 页 Google 官方提示工程白皮书 PDF 文件的
把学术论文改写成科普文章的提示词：Gemini 2.5 Pro
推荐文章的提示词
提示词救不了平庸的 AI 写作
栏目对话和访谈：Sebastian Raschka 和 Nathan Lambert 在 Lex Fridman 播客深度解读 AI 现状：中美竞争、模型对比、规模定律、AGI 时间线。
测试 Chrome 内置 Gemini Nano 大语言模型 (4bit 3.25B) 的方法
深度之赌：从卧室到上帝机器
简单有效的将音频转成各式良好对话文本的方案
让 Gemini 帮我分析 14 万行混淆后的 js 代码
释放创造力：解密 AI 贴纸生成器的“神级”提示词模板
实测 Kimi 年前三大新品：K2.5 前端设计追平 Gemini 3 Pro，Agent 集群能力惊艳
谷歌全面加速 AI 应用侧基础设施
Alma：多模型聚合的桌面 AI 客户端
Google ADK：Agent 开发工具包与多语言部署支持
LangExtract：Python 库非结构化文本结构化提取
one-api：LLM API 管理 & 分发系统
prompt-optimizer：提示词优化工具
CLIProxyAPI：面向 AI 编程 CLI 的多模型代理 API
MiniCPM-o：A Gemini 2, 5 Flash Level MLLM for Vision, Speech
AionUi：开源多 agent 协作桌面应用（Gemini CLI、Claude Code、Codex、OpenCode）
Gemini CLI：终端优先的开源 AI agent
cc-switch：A cross-platform desktop All-in-One assistant tool for Claude Code
chatbox：开源 GPLv3 多端 AI 客户端与多模型接入工具
gemini-fullstack-langgraph-quickstart：基于 React、LangGraph 和 Gemini 2.5 构建的全栈 AI 代理快速入门项目，该代理能够通过谷歌搜索进行迭代式网
qwen-code：基于 TypeScript 开发、专为终端环境和 Qwen3-Coder 模型优化的开源 AI 编程助手与智能体（Agent）
Awesome-Nano-Banana-images：精选资源库，汇集了由 Nano Banana 及其 Pro 版本生成的创意图像与提示词案例
awesome-chatgpt-prompts：ChatGPT 提示词清单
CL4R1T4S：旨在推动 AI 系统透明化的开源项目，收集并公开了 ChatGPT、Claude、Gemini 等几乎所有主流 AI 模型及智能体被泄露的系统提示词与内部指令
GPT_API_free：Free ChatGPT&DeepSeek API Key，免费ChatGPT&DeepSeek API
system_prompts_leaks：专门收集和公开 ChatGPT、Claude 和 Gemini 等主流 AI 聊天机器人系统提示词（System Prompts）的开源项目

Created with Quartz v4.5.2 © 2026

GitHub