1. 原生OpenAI格式
api.huandutech.com
  • 全链路API聚合
    • 模型接口
      • 列出模型
        • 原生OpenAI格式
        • 原生Gemini格式
      • 聊天(Chat)
        • OpenAI
          • ChatCompletions格式
            • 基础文本对话
            • 流式响应
            • Logprobs 请求
            • 内容补全接口
            • PDF文件分析
            • Codex
            • response_format
            • N测试
            • gpt-4-all(分析图片)
            • xAI联网搜索
            • 令牌用量查询(Token Usage)
          • Responses格式
            • 基础文本响应
            • 图像分析响应
            • 网络搜索工具
            • 文件搜索工具
            • Computer use
            • 流式响应
            • deep-research / 深度研究
            • 函数调用
            • 推理能力
        • Google Gemini
          • OpenAI兼容格式
            • 图片理解
            • 函数调用
            • 联网搜索
            • 文本生成
            • 文本生成 / 强制返回思考
            • 文本生成 / 自定义思考预算
            • 全能多模态版本
            • 文本转语音 / TTS
            • 音频理解
            • 视频理解
          • 原生Gemini格式
            • Gemini文本聊天
            • Gemini媒体识别
            • 视频理解(原生Gemini格式)
        • Anthropic Claude
          • 原生Claude格式(推荐)
            • 文本生成
            • 图片理解
            • 文本生成 / 强制返回思考
            • 函数调用
            • 多轮函数调用
            • Web search / 联网搜索
          • OpenAI兼容格式
            • 多轮函数调用
            • Web search / 联网搜索
      • Midjourney
        • 1.文生图(Imagine)接口
        • 2.按钮点击(Action)接口
        • 3.图片融合(Blend)接口
        • 4.窗口执行(Modal)接口
        • 5.图生文(Describe)接口
        • 6.缩短提示词(Shorten)接口
        • 7.换脸(FaceSwap)接口
        • 8.上传(upload)接口
        • 9.查询接口
        • 10.批量查询接口
        • 11.获取种子(Seed)接口
        • 13.编辑图片(Edit)接口
        • 14.生成视频(Video)接口
        • 文生图 / OpenAI兼容接口
      • 图像(Images)
        • OpenAI格式
          • 图片生成 / gpt-image-1.5
          • 图片生成 / dall-e-3
          • 图片编辑 / edits接口
          • 图片编辑 / 网页版
          • 图片变体生成
          • gpt-4-all(生成图片)
          • xAI
        • Google Gemini
          • OpenAI聊天格式
            • 图片生成(Nano-banana2)
            • 图片生成(Nano-banana2-4K)
            • 图片生成 / Imagen 4
            • 图片编辑(Nano-banana)
            • 图片生成
            • 图片编辑
          • Gemini原生格式
            • 图像生成
        • 豆包(Doubao)
          • 文生图(纯文本输入单图输出)
          • 图文生图(单图输入单图输出)
          • 多图融合(多图输入单图输出)
          • 组图输出(多图输出)
        • 阿里通义千问
          • 文生图-Z-Image
          • 文生图
          • 文生图V2版
          • 文生图V1
          • 图像生成与编辑2.6
          • 通用图像编辑2.5
        • xAI / OpenAI兼容接口
        • flux / OpenAI兼容接口
        • flux-kontext-pro / OpenAI兼容接口
        • stable-diffusion / OpenAI兼容接口
        • ideogram / OpenAI兼容接口
        • recraftv3 / OpenAI兼容接口
        • flux携带参考图 / OpenAI兼容接口
      • 视频(Videos)
        • Sora-2
          • Sora-2(创建视频)
          • Sora-2(创建视频-带 Character)
          • Sora2官方接口(Chat格式)
          • 查询视频1(异步任务)
          • 查询视频2(异步任务)
          • 获取视频内容
        • 豆包(Doubao)
          • 豆包-文生视频
          • 查询视频
        • 即梦(Jimeng)
          • 即梦AI-文生视频S2.0Pro
        • Vidu
          • 查询视频
          • Vidu-文生视频
        • 可灵AI(Kling)
          • 可灵AI-文生视频
          • 可灵AI-文生视频kling-video-o1
          • 可灵AI-带参考视频kling-video-o1
          • 可灵AI-图生视频
        • 阿里通义千问
          • 通义万相2.6(创建视频)
          • 通义万相2.5(创建视频)
          • 查询视频(异步任务)
        • Veo 3
          • Veo 视频生成(Form-Data 格式)
          • Veo 视频生成(官方格式)
          • 查询视频生成状态
          • 查询视频生成状态(官方格式)
        • OpenAI兼容接口
          • Veo 视频生成(OpenAI 兼容格式)
          • 查询视频生成状态
          • luma
          • runway
          • 智谱清言GLM
          • 可灵
          • 通义万相(OpenAI兼容)
          • 通义万相(查询视频)
      • 音频(Audio)
        • 原生OpenAI格式
          • 文本转语音 / TTS
            POST
          • 语音转文本 / whisper-1
            POST
          • 语音转文本 / gpt-4o-transcribe
            POST
          • 音频翻译
            POST
          • Audio接口 / 输出
            POST
          • Audio接口 / 输入
            POST
          • MiniMax语音合成TTS
            POST
          • 豆包语音2.0
            POST
        • 原生Gemini格式
          POST
      • 音乐(Music)
        • Suno
          • 生成歌曲
          • 生成歌词
          • 上传音乐
          • 歌曲拼接
          • 单个查询任务
          • 批量查询任务
        • Udio
          • Udio(Chat格式)
      • 嵌入(Embeddings)
        • 创建文本嵌入(OpenAI)
        • 批量创建嵌入(OpenAI)
        • 创建文本嵌入(Gemini)
      • 重排序 (Rerank)
        • Jina AI 重排序格式
        • Cohere 重排序格式
        • Xinference 重排序格式
      • 审查(Moderations)
        • 创建内容审核
      • GPTs 相关
        • GPTs对话
        • 搜索相关 GPTs
        • 查询 GPTs 详情
        • 批量查询 GPTs 详情
  1. 原生OpenAI格式

豆包语音2.0

主站接口
https://api.huandutech.com/v1
主站接口
https://api.huandutech.com/v1
POST
https://api.huandutech.com/v1
/audio/speech
每个音色能支持的情感不同,
具体参考音色情感列表: https://www.volcengine.com/docs/6561/1257544
开心(happy),悲伤(sad),生气(angry),惊讶(surprised),恐惧(fear)...
所有在openai标准之外的参数按原厂格式写在metadata里, 支持所有格式
音色示例: 通过调整emotion参数

请求参数

Authorization
Bearer Token
在 Header 添加参数
Authorization
,其值为在 Bearer 之后拼接 Token
示例:
Authorization: Bearer ********************
or
Header 参数

Body 参数application/json

示例
{
    "input": "你是一个好孩子",
    "model": "seed-tts-1.1",
    "response_format": "mp3",
    "speed": 1,
    "voice": "zh_female_shuangkuaisisi_emo_v2_mars_bigtts",
    "metadata": {
        "audio": {
            "emotion_scale": 5,
            "enable_emotion": true,
            "emotion": "happy"
        }
    }
}

请求示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://api.huandutech.com/v1/audio/speech' \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: application/json' \
--data-raw '{
    "input": "你是一个好孩子",
    "model": "seed-tts-1.1",
    "response_format": "mp3",
    "speed": 1,
    "voice": "zh_female_shuangkuaisisi_emo_v2_mars_bigtts",
    "metadata": {
        "audio": {
            "emotion_scale": 5,
            "enable_emotion": true,
            "emotion": "happy"
        }
    }
}'

返回响应

🟢200成功
application/json
Body

示例
{}
上一页
MiniMax语音合成TTS
下一页
原生Gemini格式
Built with