官方文档：https://ai.google.dev/gemini-api/docs/image-generation?hl=zh-cn

Nano Banana 是 Gemini 原生图片生成功能的名称。 Gemini 能够以对话方式生成并处理图片，您可以使用文本、图片或两者结合来发出提示。这样一来，您即可以前所未有的精准度创建、修改和迭代视觉内容。

Nano Banana 是指 Gemini API 中提供的三种不同的模型：

Nano Banana 2：Gemini 3.1 Flash Image 预览版模型 (gemini-3.1-flash-image-preview)。此模型是 Gemini 3 Pro Image 的高效率版本，针对速度和高用量开发者使用情形进行了优化。
Nano Banana Pro：Gemini 3 Pro Image 预览版模型 (gemini-3-pro-image-preview)。此模型专为专业资产制作而设计，利用高级推理（“思考”）功能来遵循复杂的指令并呈现高保真文本。
Nano Banana：Gemini 2.5 Flash Image 模型 (gemini-2.5-flash-image)。此模型专为速度和效率而设计，经过优化，可处理海量低延迟任务。

限制

为获得最佳性能，请使用以下语言：英语、ar-EG、de-DE、es-MX、fr-FR、hi-IN、id-ID、it-IT、ja-JP、ko-KR、pt-BR、ru-RU、ua-UA、vi-VN、zh-CN。
图片生成不支持音频或视频输入。
模型不一定会生成用户明确要求的确切数量的图片输出。
gemini-2.5-flash-image 最多可接受 3 张图片作为输入，而 gemini-3-pro-image-preview 支持 5 张高保真图片，总共最多可接受 14 张图片。gemini-3.1-flash-image-preview 支持在单一工作流中保持多达 4 个角色的相似度，并保持多达 10 个物体的细节保真度。
在为图片生成文本时，如果先生成文本，再要求生成包含该文本的图片，Gemini 的效果会最佳。
gemini-3.1-flash-image-preview 目前，使用 Google 搜索进行接地不支持使用网络搜索中的人物真实世界图片。

模型选择

选择最适合您的特定使用场景的模型。

Gemini 3.1 Flash Image 预览版（Nano Banana 2 预览版）应该是您的首选图片生成模型，因为它在性能和智能方面都非常出色，并且在成本和延迟之间实现了平衡。如需了解详情，请参阅模型价格和功能页面。

Gemini 3 Pro Image 预览版（Nano Banana Pro 预览版）专为专业资源制作和复杂指令而设计。该模型具有以下特点：使用 Google 搜索进行现实世界接地、默认的“思考”流程（在生成之前优化构图），并且可以生成分辨率高达 4K 的图片。如需了解详情，请参阅模型价格和功能页面。

Gemini 2.5 Flash Image (Nano Banana) 旨在实现速度和效率。此模型经过优化，可处理大批量、低延迟的任务，并生成 1024 像素分辨率的图片。如需了解详情，请查看模型价格和功能页面。

Nano Banana

限制#

模型选择#

限制

模型选择