豆包语音2.0

主站接口

https://api.huandutech.com/v1

POST

/audio/speech

每个音色能支持的情感不同,
具体参考音色情感列表: https://www.volcengine.com/docs/6561/1257544
开心（happy），悲伤（sad），生气（angry），惊讶（surprised），恐惧（fear）...
所有在openai标准之外的参数按原厂格式写在metadata里, 支持所有格式
音色示例: 通过调整emotion参数

请求参数

Authorization

Bearer Token

在 Header 添加参数

Authorization

，其值为在 Bearer 之后拼接 Token

示例：

Authorization: Bearer ********************

Header 参数

Body 参数application/json

示例

{
    "input": "你是一个好孩子",
    "model": "seed-tts-1.1",
    "response_format": "mp3",
    "speed": 1,
    "voice": "zh_female_shuangkuaisisi_emo_v2_mars_bigtts",
    "metadata": {
        "audio": {
            "emotion_scale": 5,
            "enable_emotion": true,
            "emotion": "happy"
        }
    }
}

请求示例代码

Shell

JavaScript

Java

Swift

PHP

Python

HTTP

Objective-C

Ruby

OCaml

Dart

curl --location --request POST 'https://api.huandutech.com/v1/audio/speech' \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: application/json' \
--data-raw '{
    "input": "你是一个好孩子",
    "model": "seed-tts-1.1",
    "response_format": "mp3",
    "speed": 1,
    "voice": "zh_female_shuangkuaisisi_emo_v2_mars_bigtts",
    "metadata": {
        "audio": {
            "emotion_scale": 5,
            "enable_emotion": true,
            "emotion": "happy"
        }
    }
}'

返回响应

🟢200成功

application/json

Body

示例

{}

MiniMax语音合成TTS

原生Gemini格式