GPT Image 2 图片生成

接口概述

GPT Image 2 是 OpenAI 最新一代图片生成模型，支持根据文本描述生成高质量图片。本平台完全兼容 OpenAI 官方接口规范，您可以使用已有的 OpenAI SDK 或 HTTP 请求直接调用。

本平台提供两种接口和两种通道：

接口：

接口	地址	用途
Images API	`POST /v1/images/generations`	纯文本生图
Responses API	`POST /v1/responses`	文本生图 + 图片重绘编辑，支持多轮对话

模型版本：

模型	说明
`gpt-image-2`	原生标准通道：标准 Token 计费，API 参数与行为规范与 OpenAI 官方一致。

`gpt-image-2-sp`	融合优化通道：单次请求计费，通过网关资源优化降低单次调用成本。

两个模型底层调用相同的 AI 模型能力，共用同一接口地址，通过 model 参数区分。请根据您的 API Key 对应的模型选择正确的名称。

一、Images API — 文本生图

基本信息

项目	说明
请求地址	`POST https://api.modelport.ai/v1/images/generations`
认证方式	`Authorization: Bearer YOUR_API_KEY`
请求格式	`Content-Type: application/json`

快速开始

cURL

Python

Node.js

请求参数

参数	类型	必填	默认值	说明
`model`	string	是	—	模型名称：`gpt-image-2` 或 `gpt-image-2-sp`
`prompt`	string	是	—	图片描述文本，支持中英文
`size`	string	否	`1024x1024`	图片尺寸，详见下文
`quality`	string	否	`auto`	图片质量：`auto` / `high` / `medium` / `low`
`n`	integer	否	`1`	生成图片数量，详见下文
`response_format`	string	否	`b64_json`	返回格式，详见下文

返回结构

b64_json 格式（默认）：

{
  "created": 1777120429,
  "data": [
    {
      "b64_json": "iVBORw0KGgo..."
    }
  ],
  "usage": {
    "total_tokens": 780,
    "input_tokens": 15,
    "output_tokens": 765
  }
}

url 格式：

{
  "created": 1777195145,
  "data": [
    {
      "url": "https://example.com/generated-image.png"
    }
  ],
  "usage": {
    "total_tokens": 780,
    "input_tokens": 15,
    "output_tokens": 765
  }
}

字段	类型	说明
`created`	integer	请求创建的 Unix 时间戳
`data`	array	图片数据数组
`data[].b64_json`	string	base64 编码的图片数据（PNG）
`data[].url`	string	图片链接（仅 url 格式时返回）
`usage.total_tokens`	integer	总 Token 消耗
`usage.input_tokens`	integer	输入 Token 数
`usage.output_tokens`	integer	输出 Token 数

二、Responses API — 生图与重绘

Responses API 支持更丰富的图片生成场景，包括文本生图和图片重绘编辑（基于已有图片进行修改）。

基本信息

项目	说明
请求地址	`POST https://api.modelport.ai/v1/responses`
认证方式	`Authorization: Bearer YOUR_API_KEY`
请求格式	`Content-Type: application/json`
支持模型	`gpt-5.5`等（通过 `image_generation` 工具调用图像生成模型，图像模型由 gpt-5.5 内部自动路由 — 它作为 tool call 执行，具体调哪个图像模型是上游 LLM 自己决定的。如果需要确保用 gpt-image-2，需要走 /v1/images/generations 或 /v1/images/edits，在参数中明确指定 "model": "gpt-image-2"。通过 /v1/responses 无法控制底层图像模型。）

文本生图

通过 Responses API 生成图片时，需在 tools 中声明 image_generation 工具：

图片重绘 / 编辑

传入已有图片和修改指令，即可对图片进行编辑。支持传入图片 URL 或 base64 Data URI：

Responses API 返回结构

{
  "id": "resp_xxx",
  "object": "response",
  "status": "completed",
  "model": "gpt-5.5",
  "output": [
    {
      "type": "image_generation_call",
      "status": "completed",
      "action": "generate",
      "size": "1024x1024",
      "quality": "high",
      "result": "iVBORw0KGgo...",
      "revised_prompt": "模型优化后的提示词..."
    },
    {
      "type": "message",
      "content": [
        {
          "type": "output_text",
          "text": "模型的文本回复..."
        }
      ]
    }
  ]
}

字段	说明
`output[].type`	`image_generation_call`（图片）或 `message`（文本）
`output[].action`	`generate`（新生成）或 `edit`（编辑已有图片）
`output[].result`	base64 编码的图片数据
`output[].size`	生成的图片尺寸
`output[].revised_prompt`	模型实际使用的优化后提示词

三、参数详细说明

图片尺寸（size）

标准尺寸

模型支持以下尺寸：

size	宽高比	适用场景
`1024x1024`	1:1	头像、图标、社交媒体配图
`1536x1024`	3:2	横版海报、网页 Banner、风景图
`1024x1536`	2:3	竖版海报、手机壁纸、人像图

自定义尺寸

可尝试自定义分辨率。自定义尺寸需满足以下条件：

条件	要求
最低像素	宽 × 高 ≥ 1,048,576（约 1024×1024）
对齐规则	宽和高均为 16 的整数倍
最大边长	单边不超过 2048 像素（推荐上限）

常用自定义尺寸：

size	宽高比	适用场景
`1280x720`	16:9	视频封面、演示文稿
`1792x1024`	7:4	宽幅海报
`2048x2048`	1:1	高清方图

不支持的尺寸示例：

size	失败原因
`512x512`	总像素低于最低要求
`1920x1080`	1080 不是 16 的整数倍（1080 ÷ 16 = 67.5）
`4096x4096`	单边超过限制

自定义尺寸为扩展能力，支持范围可能随Openai更新调整，请以实际调用结果为准。

图片质量（quality）

quality	说明
`auto`	模型自动选择（默认）
`high`	高质量，细节丰富，耗时较长
`medium`	中等质量，兼顾效果与速度
`low`	低质量，生成速度快，适合草稿预览

批量生成（n）

模型	支持范围	说明
`gpt-image-2`	1 ~ 10	单次请求生成多张图片，`data` 数组包含对应数量的结果
`gpt-image-2-sp`	1	当前版本每次请求生成 1 张图片

gpt-image-2 批量生成示例：

批量生成时，Token 消耗与图片数量几乎成正比。

gpt-image-2-sp 生成多张图片：

gpt-image-2-sp 需通过多次请求实现：

返回格式（response_format）

仅适用于 Images API。

b64_json：返回 base64 编码的图片数据，解码后为 PNG 格式

url：返回图片链接

高分辨率图片（2048×2048）的 base64 数据量较大（约 8MB），
如果需要返回 base64 编码的图片，可指定"response_format": "b64_json"

url 格式请求示例：

base64 格式请求示例：

四、通道能力对比

Images API

能力	gpt-image-2	gpt-image-2-sp
标准尺寸	1024×1024 / 1536×1024 / 1024×1536	1024×1024 / 1536×1024 / 1024×1536
批量生成 (n)	1~10	1
quality	auto / high / medium / low	auto / high / medium / low
size=auto	支持	—

Responses API

能力	不能精确路由到gpt-image-2模型
文本生图	支持（通过 gpt-5.5 等模型）
图片重绘 / 编辑	支持（通过 gpt-5.5 等模型）

五、性能参考

以下数据基于实际测试，供参考：

尺寸	质量	单张耗时	Token 消耗	图片大小
1024×1024	high	20~30s	~780	1~2 MB
1024×1024	low	20~30s	~780	~1 MB
1536×1024	high	50~70s	~1,120	2~3 MB
1024×1536	high	50~70s	~1,120	2~3 MB
2048×2048	high	80~140s	~780	7~9 MB

以上为典型参考值，实际耗时受提示词复杂度和服务负载影响。

六、错误处理

常见错误码

HTTP 状态码	说明	处理建议
400	参数不合法（如尺寸格式错误）	检查请求参数
401	API Key 无效或已过期	核实 Key 是否正确
403	无权访问该模型	确认 Key 与模型名称匹配
429	请求频率超限	降低频率后重试
500	服务端错误	稍后重试，持续出现请联系技术支持

错误返回示例

{
  "error": {
    "message": "错误描述信息",
    "type": "server_error"
  }
}

七、最佳实践

提示词：使用具体、详细的描述，包含主体、风格、构图、光线等关键词。

尺寸选择：优先使用标准尺寸。使用自定义尺寸时，确保宽高为 16 的整数倍。

超时设置：客户端超时建议 120 秒以上；高分辨率或批量请求建议 300 秒以上。

高分辨率传输：2048 尺寸的 base64 数据量大（约 8MB）。

错误重试：5xx 错误等待 3~5 秒后重试，最多 3 次。

批量生成：gpt-image-2 使用 n 参数；gpt-image-2-sp 通过多次请求实现，建议间隔 1~2 秒。

图片编辑：需要重绘或修改已有图片时，使用 Responses API，传入原图和修改指令。单次图片编辑可使用

GPT Image 2

GPT Image 2 图片生成#

接口概述#

一、Images API — 文本生图#

基本信息#

快速开始#

cURL#

Python#

Node.js#

请求参数#

返回结构#

二、Responses API — 生图与重绘#

基本信息#

文本生图#

图片重绘 / 编辑#

Responses API 返回结构#

三、参数详细说明#

图片尺寸（size）#

标准尺寸#

自定义尺寸#

图片质量（quality）#

批量生成（n）#

返回格式（response_format）#

四、通道能力对比#

Images API#

Responses API#

五、性能参考#

六、错误处理#

常见错误码#

错误返回示例#

七、最佳实践#

GPT Image 2 图片生成

接口概述

一、Images API — 文本生图

基本信息

快速开始

cURL

Python

Node.js

请求参数

返回结构

二、Responses API — 生图与重绘

基本信息

文本生图

图片重绘 / 编辑

Responses API 返回结构

三、参数详细说明

图片尺寸（size）

标准尺寸

自定义尺寸

图片质量（quality）

批量生成（n）

返回格式（response_format）

四、通道能力对比

Images API

Responses API

五、性能参考

六、错误处理

常见错误码

错误返回示例

七、最佳实践