Nano Banana 是 Gemini 原生图片生成功能的名称。 Gemini 能够以对话方式生成并处理图片,您可以使用文本、图片或两者结合来发出提示。这样一来,您即可以前所未有的精准度创建、修改和迭代视觉内容。Nano Banana 是指 Gemini API 中提供的三种不同的模型:Nano Banana 2:Gemini 3.1 Flash Image 预览版模型 (gemini-3.1-flash-image-preview)。此模型是 Gemini 3 Pro Image 的高效率版本,针对速度和高用量开发者使用情形进行了优化。
Nano Banana Pro:Gemini 3 Pro Image 预览版模型 (gemini-3-pro-image-preview)。此模型专为专业资产制作而设计,利用高级推理(“思考”)功能来遵循复杂的指令并呈现高保真文本。
Nano Banana:Gemini 2.5 Flash Image 模型 (gemini-2.5-flash-image)。此模型专为速度和效率而设计,经过优化,可处理海量低延迟任务。为获得最佳性能,请使用以下语言:英语、ar-EG、de-DE、es-MX、fr-FR、hi-IN、id-ID、it-IT、ja-JP、ko-KR、pt-BR、ru-RU、ua-UA、vi-VN、zh-CN。
图片生成不支持音频或视频输入。
模型不一定会生成用户明确要求的确切数量的图片输出。
gemini-2.5-flash-image 最多可接受 3 张图片作为输入,而 gemini-3-pro-image-preview 支持 5 张高保真图片,总共最多可接受 14 张图片。gemini-3.1-flash-image-preview 支持在单一工作流中保持多达 4 个角色的相似度,并保持多达 10 个物体的细节保真度。
在为图片生成文本时,如果先生成文本,再要求生成包含该文本的图片,Gemini 的效果会最佳。
gemini-3.1-flash-image-preview 目前,使用 Google 搜索进行接地不支持使用网络搜索中的人物真实世界图片。模型选择#
Gemini 3.1 Flash Image 预览版(Nano Banana 2 预览版)应该是您的首选图片生成模型,因为它在性能和智能方面都非常出色,并且在成本和延迟之间实现了平衡。如需了解详情,请参阅模型价格和功能页面。Gemini 3 Pro Image 预览版(Nano Banana Pro 预览版)专为专业资源制作和复杂指令而设计。该模型具有以下特点:使用 Google 搜索进行现实世界接地、默认的“思考”流程(在生成之前优化构图),并且可以生成分辨率高达 4K 的图片。如需了解详情,请参阅模型价格和功能页面。Gemini 2.5 Flash Image (Nano Banana) 旨在实现速度和效率。此模型经过优化,可处理大批量、低延迟的任务,并生成 1024 像素分辨率的图片。如需了解详情,请查看模型价格和功能页面。 修改于 2026-04-20 02:04:47