1. st-ai开放平台接口
st-ai
  • st-ai开放平台接口
    • st-ai 通用接口文档
    • 即梦视频生成3.5-pro
    • 文生图生成接口
      POST
    • 图生图接口
      POST
    • nano-banana接口
      POST
    • 即梦4.0官方API接口
      POST
    • sora2创建视频
      POST
    • sora2视频查询
      GET
    • veo3.1文本创建视频
      POST
    • veo3.1创建视频首帧
      POST
    • veo3.1创建视频首尾帧
      POST
    • veo3.1创建视频多图参考
      POST
    • veo3.1视频查询
      GET
  1. st-ai开放平台接口

即梦4.0官方API接口

POST
https://api.sora2.pub/v1/images/generations

📖 简介#

Seedream 4.0 是一个强大的 AI 图像生成模型,支持:
✍️ 文本生图:通过文字描述生成图片
🖼️ 图生图:基于已有图片进行编辑和创作
🎨 多图融合:融合多张图片的风格和元素
📚 组图生成:一次生成多张关联的图片

🎯 核心功能展示#

1️⃣ 多参考图生图#

输入多张参考图,融合它们的风格、元素等特征来生成新图像。
示例:将图1的服装换为图2的服装

2️⃣ 组图生成#

基于文字和图片,生成一组内容关联的图像。
示例:参考 LOGO,做一套户外运动品牌视觉设计,品牌名称为"GREEN",包括包装袋、帽子、纸盒、卡片、手环、挂绳等。绿色视觉主色调,趣味、简约现代风格。

📊 模型基本信息#

参数说明
模型名称doubao-seedream-4.0
模型版本250828
模型 IDdoubao-seedream-4-0-250828
支持能力文生图、单图生图、多图生图、组图生成
限流500 张/分钟

⚙️ 使用前准备#

1.
✅ 获取 API Key
2.
✅ 开通模型服务
3.
✅ 获取 Model ID
4.
✅ (可选)创建自定义推理接入点

⚠️ 重要提示#

不支持的参数:
seed:可以传入,但不会生效
guidance_scale:传入会报错
提示词建议:
中文不超过 300 字
英文不超过 600 词
字数过多会导致信息分散,模型可能忽略部分细节

💡 使用示例#

场景 1:文生图(纯文本生成单张图片)#

只需要文字描述,就能生成对应的图像。
cURL 示例:

场景 2:图文生图(单图输入单图输出)#

基于已有图片,结合文字指令进行图像编辑,包括:
图像元素增删
风格转化
材质替换
色调迁移
改变背景/视角/尺寸等
cURL 示例:

场景 3:多图融合(多图输入单图输出)#

根据您输入的文本描述和多张参考图片,融合它们的风格、元素等特征来生成新图像。
应用场景:
衣裤鞋帽与模特图融合成穿搭图
人物与风景融合为人物风景图
等等...
参数设置:
不指定 sequential_image_generation
或设置为 disabled
cURL 示例:

场景 4:组图生成(一次生成多张关联图片)#

通过文字或图片,一次生成多张内容关联的图片。
应用场景:
漫画分镜
品牌视觉设计
连环画
故事书配图
参数设置:
sequential_image_generation: auto
sequential_image_generation_options: 设置 max_images 参数(最多生成多少张)

4.1 文生组图#

cURL 示例:

4.2 单张图生组图#

cURL 示例:

4.3 多参考图生组图#

cURL 示例:

🚀 高级功能#

流式输出#

通过参数 stream: true 开启流式输出模式,模型生成完任一图片即返回结果,让您能更快浏览到生成的图像,改善等待体验。
cURL 示例:

控制图片尺寸#

方式 1:指定像素值#

通过参数 size 显式指定图像宽高像素值,例如 "2048x2048"。
cURL 示例:

方式 2:指定分辨率#

通过参数 size 指定图像分辨率(如 "2K"),结合 prompt 中描述的图片宽高比、图片形状、图片用途,让模型智能控制生成图片的大小。
cURL 示例:

📚 附录:故事书/连环画制作#

功能介绍#

火山方舟大模型体验中心提供了故事书和连环画功能,该功能结合了:
doubao-seed-1.6 模型(文本生成)
doubao-seedream-4.0 模型(图片生成)
可实现一句话生成动漫、连环画、故事书,满足用户多样化的创作需求。

工作流程#

故事书生成的工作流如下:
1.
用户输入 → 提供提示词和参考图
2.
文本生成 → 调用 doubao-seed-1.6 模型生成故事内容
3.
分镜拆解 → 将故事拆分成多个分镜场景
4.
图片生成 → 调用 doubao-seedream-4.0 模型生成配图
5.
内容整合 → 拼装文字和图片,形成完整故事书

技术实现详解#

步骤 1:调用 doubao-seed-1.6 生成故事内容#

根据用户提供的提示词和参考图,调用模型进行:
故事创作
故事分镜拆解(5-10个分镜)
生成分镜的文案和画面描述
生成书名和故事总结
汇总成 JSON 格式输出
System Prompt 参考:
点击展开完整 Prompt
# 角色

你是一位绘本创作大师。

## 任务

贴合用户指定的读者群(儿童/青少年/成人/全年龄),创作情节线性连贯的、生动有趣的、
充满情绪价值和温度的、有情感共鸣的、分镜-文案-画面严格顺序对应的绘本内容:

- 核心约束:分镜拆分→文案(scenes)→画面描述(scenes_detail)必须1:1顺序绑定,
  从故事开头到结尾,像「放电影」一样按时间线推进,绝无错位。

## 工作流程

1. 充分理解用户诉求。优先按照用户的创作细节要求执行(如果有)
2. **故事构思**:创作一个能够精准回应用户诉求、提供情感慰藉的故事脉络。
   整个故事必须围绕"共情"和"情绪价值"展开。
3. **分镜结构与数量**:
   - 将故事浓缩成 5~10 个关键分镜,最多10个(不能超过10个)
   - 必须遵循清晰的叙事弧线:开端 → 发展 → 高潮 → 结局
4. **文案与画面(一一对应)**:
   - **文案("scenes"字段)**:为每个分镜创作具备情感穿透力的文案。
     文案必须与画面描述紧密贴合,共同服务于情绪的传递。
     禁止在文案中使用任何英文引号。不能超过10个。
   - **画面("scenes_detail"字段)**:为每个分镜构思详细的画面。
     画风必须贴合用户诉求和故事氛围。
     描述需包含构图、光影、色彩、角色神态等关键视觉要素,
     达到可直接用于图片生成的标准。
5. **书名("title"字段)**:
   - 构思一个简洁、好记、有创意的书名
   - 书名必须能巧妙地概括故事精髓,并能瞬间"戳中"目标用户的情绪共鸣点
6. **故事总结("summary"字段)**:
   - 创作一句不超过30个汉字的总结
   - 总结需高度凝练故事的核心思想与情感价值
7. 整合输出:将所有内容按指定 JSON 格式整理输出

## 安全限制

生成的内容必须严格遵守以下规定:
1. **禁止暴力与血腥**:不得包含任何详细的暴力、伤害、血腥或令人不适的画面描述
2. **禁止色情内容**:不得包含任何色情、性暗示或不适宜的裸露内容
3. **禁止仇恨与歧视**:不得包含针对任何群体的仇恨、歧视或攻击性言论
4. **禁止违法与危险行为**:不得描绘或鼓励任何非法活动、自残或危险行为
5. **确保普遍适宜性**:整体内容应保持在社会普遍接受的艺术创作范围内

## 输出格式要求

整理成以下 JSON 格式,scenes 和 scenes_detail 要与分镜保持顺序一致,一一对应:

{  
  "title": "书名",
  "summary": "30字内的总结",
  "scenes": [
    "分镜1的文案,用50字篇幅传递情绪和情感,引发读者共鸣",
    "分镜2的文案"
  ],
  "scenes_detail": [
    "图片1:这是第一页的画面描述。必须以'图片'+序号开头。要有强烈的视觉感,详细描述构图、光影、色彩、角色表情、动作和环境细节",
    "图片2:..."
  ]
}

步骤 2:处理图片生成的 Prompt#

从 JSON 结果中提取 scenes_detail 字段,并进行处理:
1.
将 scenes_detail 数组转化成字符串
2.
在 prompt 开头添加用户输入的提示词
3.
在 prompt 末尾补充:"最后,为故事书创作一个封面。再检查所有图片,去除图片中的文字"

步骤 3:调用 doubao-seedream-4.0 生成配图#

根据处理后的 Prompt 和用户提供的参考图,调用 doubao-seedream-4.0 模型的组图生成能力,为故事的所有分镜文案生成配图。

步骤 4:内容整合#

按照顺序拼装图片和文字即可得到故事书内容,用户按需进行展示。

🎉 总结#

Seedream 4.0 是一个功能强大的图像生成模型,支持:
✍️ 文本生图
🖼️ 单图/多图融合
📚 组图生成
🎬 流式输出
📐 灵活的尺寸控制
配合 doubao-seed-1.6 模型,还可以实现复杂的故事书和连环画创作。

请求参数

Header 参数

Body 参数application/json必填

示例
{
  "model": "doubao-seedream-4-0-250828",
  "prompt": "生成3张女孩和奶牛玩偶在游乐园开心地坐过山车的图片,涵盖早晨、中午、晚上",
  "image": [
    "https://ark-project.tos-cn-beijing.volces.com/doc_image/seedream4_imagesToimages_1.png",
    "https://ark-project.tos-cn-beijing.volces.com/doc_image/seedream4_imagesToimages_2.png"
  ],
  "sequential_image_generation": "auto",
  "sequential_image_generation_options": {
    "max_images": 3
  },
  "size": "2K"
}

请求示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://api.sora2.pub/v1/images/generations' \
--header 'Authorization: Bearer {{api_token}}' \
--header 'Content-Type: application/json' \
--data-raw '{
  "model": "doubao-seedream-4-0-250828",
  "prompt": "生成3张女孩和奶牛玩偶在游乐园开心地坐过山车的图片,涵盖早晨、中午、晚上",
  "image": [
    "https://ark-project.tos-cn-beijing.volces.com/doc_image/seedream4_imagesToimages_1.png",
    "https://ark-project.tos-cn-beijing.volces.com/doc_image/seedream4_imagesToimages_2.png"
  ],
  "sequential_image_generation": "auto",
  "sequential_image_generation_options": {
    "max_images": 3
  },
  "size": "2K"
}'

返回响应

🟢200成功
application/json
Body

示例
{"data":[{"url":"https://cdn.vmimgs.com/datarm/user/result/20251023/ad4b8012-6065-4868-b62d-9f4b9a7672e3.jpg?OSSAccessKeyId=LTAI5tNM9qWxkwzrvthQ6zYZ&Expires=1761236692&Signature=s5GqFcDmLWkk1h0Cgwe1cGK1lhQ%3D","b64_json":"","revised_prompt":""}],"created":1761222271}
修改于 2025-10-23 12:52:58
上一页
nano-banana接口
下一页
sora2创建视频
Built with