1. 图片NanoBanana
ModelPort.AI 接口文档
  • 快速开始
    • 平台简介
    • 控制台(入门)
    • API key
    • Base URL
  • AI大模型接口
    • 图像
      • GPT Image 2
      • Kwai-Kolors
      • flux-kontext-max
      • grok-imagine-image
    • 视频
      • 通用视频生成接口
      • 豆包视频
        • 文生视频示例
        • 图生视频示例
        • 查询单个任务
        • Seedance-2.0系列
      • grok视频
      • Agnes-Video
        • Agnes-Video
        • Agnes-Video查询
    • OpenAI格式(支持各大原厂模型)
      • 聊天(Response)
        • 创建模型响应
        • 创建网络搜索
        • 创建模型响应 gpt-5启用思考
        • 创建函数调用
        • 创建模型响应(流式返回)
        • 创建模型响应 (控制思考长度)
    • Anthropic格式
      • Anthropic简介
      • 聊天
      • 聊天(深度思考)
      • 聊天(新模型-深度思考)
      • 流式返回
      • 工具调用(function call)
      • 分析图片
    • 谷歌Gemini接口
      • Gemini API
      • 文本
        • 聊天
        • 文本生成-流
      • 图片NanoBanana
        • Nano Banana
        • OpenAI请求方式
          • 生成图片
          • 编辑图像
        • Gemini请求方式
          • 生成图片
          • 编辑图片
      • 视频Veo
        • Veo
      • 文档理解
        POST
    • Rerank重排序模型
      • 重排序
    • 文生音乐Suno
      • 生成歌曲(灵感模式)
      • 生成歌词
      • 查询单个任务
      • 查询批量任务
    • Midjourney格式
      • Midjourney简介
  • 素材资产
    • CreateAssetGroup
      POST
    • CreateAsset
      POST
    • GetAsset
      POST
  1. 图片NanoBanana

Nano Banana

官方文档:https://ai.google.dev/gemini-api/docs/image-generation?hl=zh-cn
Nano Banana 是 Gemini 原生图片生成功能的名称。 Gemini 能够以对话方式生成并处理图片,您可以使用文本、图片或两者结合来发出提示。这样一来,您即可以前所未有的精准度创建、修改和迭代视觉内容。
Nano Banana 是指 Gemini API 中提供的三种不同的模型:
Nano Banana 2:Gemini 3.1 Flash Image 预览版模型 (gemini-3.1-flash-image-preview)。此模型是 Gemini 3 Pro Image 的高效率版本,针对速度和高用量开发者使用情形进行了优化。
Nano Banana Pro:Gemini 3 Pro Image 预览版模型 (gemini-3-pro-image-preview)。此模型专为专业资产制作而设计,利用高级推理(“思考”)功能来遵循复杂的指令并呈现高保真文本。
Nano Banana:Gemini 2.5 Flash Image 模型 (gemini-2.5-flash-image)。此模型专为速度和效率而设计,经过优化,可处理海量低延迟任务。

限制#

为获得最佳性能,请使用以下语言:英语、ar-EG、de-DE、es-MX、fr-FR、hi-IN、id-ID、it-IT、ja-JP、ko-KR、pt-BR、ru-RU、ua-UA、vi-VN、zh-CN。
图片生成不支持音频或视频输入。
模型不一定会生成用户明确要求的确切数量的图片输出。
gemini-2.5-flash-image 最多可接受 3 张图片作为输入,而 gemini-3-pro-image-preview 支持 5 张高保真图片,总共最多可接受 14 张图片。gemini-3.1-flash-image-preview 支持在单一工作流中保持多达 4 个角色的相似度,并保持多达 10 个物体的细节保真度。
在为图片生成文本时,如果先生成文本,再要求生成包含该文本的图片,Gemini 的效果会最佳。
gemini-3.1-flash-image-preview 目前,使用 Google 搜索进行接地不支持使用网络搜索中的人物真实世界图片。

模型选择#

选择最适合您的特定使用场景的模型。
Gemini 3.1 Flash Image 预览版(Nano Banana 2 预览版)应该是您的首选图片生成模型,因为它在性能和智能方面都非常出色,并且在成本和延迟之间实现了平衡。如需了解详情,请参阅模型价格和功能页面。
Gemini 3 Pro Image 预览版(Nano Banana Pro 预览版)专为专业资源制作和复杂指令而设计。该模型具有以下特点:使用 Google 搜索进行现实世界接地、默认的“思考”流程(在生成之前优化构图),并且可以生成分辨率高达 4K 的图片。如需了解详情,请参阅模型价格和功能页面。
Gemini 2.5 Flash Image (Nano Banana) 旨在实现速度和效率。此模型经过优化,可处理大批量、低延迟的任务,并生成 1024 像素分辨率的图片。如需了解详情,请查看模型价格和功能页面。
修改于 2026-04-20 02:04:47
上一页
文本生成-流
下一页
生成图片
Built with