1. AI桌面助手 V1 AI角色
MindCraft AI
  • 在线调用-使用说明
  • 基础模型
    • 大语言模型 LLM
      • 其他平台上使用API
        • Claude Code 上使用 MindCraft API
        • GPT Codex 上使用 MindCraft API
        • Cursor上使用MindCraft API
        • Cherry Studio上使用MindCraft API
        • DIFY上使用API
        • ONE-API 上使用API
        • FastGPT 上使用API
        • 沉浸式翻译(浏览器插件) 上使用API
      • 所有模型列表
      • OpenAI Chat 模型列表
      • OpenAI Chat 接口调用
      • Anthropic 模型列表
      • Anthropic Message 接口调用
      • OpenAI Responses 接口调用
    • 语音识别 ASR
      • 语音识别请求
        • 腾讯 一句话识别
        • 腾讯 文件识别(进task任务)
        • 腾讯大模型 文件识别(进task任务)
        • 阿里 paraformer
        • 阿里 sensevoice(进task任务)
        • 字节跳动 一句话识别
        • 阿里 qwen3-asr
      • 语音识别请求(汇总)
      • 模型列表及参数获取
      • 任务(task)数据获取
    • 语音合成 TTS
      • TTS 音色列表
      • 语音合成请求
        • 字节跳动 通用合成
        • MiniMax 短文本 V2
        • MiniMax 长文本
        • 腾讯 通用合成-普通音色
        • 腾讯 通用合成-精品音色
        • 腾讯 长文本合成-普通音色
        • 腾讯 长文本合成-精品音色
        • 科大讯飞 通用合成
        • 阿里云 语音合成CosyVoice
        • 百度 短文本合成
      • 语音合成请求(汇总)
      • 模型列表及参数获取
      • 任务(task)数据获取
    • 图片生成 Images Generations
      • 图片生成请求
        • Flux 文生图
        • 智谱 文生图
        • 欧朋ai 文生图
        • 通义万象 文生图
        • 豆包 文生图
        • DeepSeek 文生图
        • MiniMax 文生图
        • Gemini 文生图
      • 图片生成请求(汇总)
      • 模型列表及参数获取
    • 视频合成 Video Generations
      • 视频合成请求
        • 智谱 文生视频
        • 智谱 图片生视频
        • MiniMax 文生视频
        • MiniMax 图生视频
        • 通义万象 文生视频
        • 通义万象 图生视频
        • 通义万象 首尾帧生成视频
        • 豆包 文生视频
        • 豆包 图生视频
        • 豆包 首尾帧生成视频
        • Gemini 文生视频
      • 视频合成请求(汇总)
      • 模型列表及参数获取
      • 任务(task)数据获取
      • 取消视频生成任务
    • RAG模型
      • embedding 多模态向量模型
      • embedding 文字向量模型
      • rerank 文字向量模型
    • 音色处理 voice processing
      • 音色克隆
        • 声音克隆流程
        • 上传音频
        • 生成试听
        • 保存克隆
    • 图生图 Image to Image
      • mask局部编辑
        • 提取 mask
        • 消除 mask
        • 重绘 mask
        • 扩图 mask
      • 图生图
        • i2i 图片一致性
        • i2i 指令编辑模型
        • i2i 超分辨率模型
        • i2i 风格化模型
        • i2i 图片调整
  • 智能体
    • 聊天机器人V3 AI角色(socket)
      • 角色资源加载规则
      • 角色人设加载
        • AI角色UUIDS数据
        • 用户人设UUIDS数据
      • ChatBot 智能体V3(socket)
    • AI桌面助手 V1 AI角色
      • AI桌面助手V1(Socket)
        POST
      • AI桌面助手V5(Socket)
        POST
    • socket Device认证
      • device 获取token
  • 对话数据
    • session 对话
      • message 聊天数据
        • message 获取列表
        • message 创建消息
        • message 修改消息
        • message 删除数据
        • message 清空记录
      • session 获取对话列表
      • session 创建新对话
      • session 更改对话
      • session 删除对话
  • 查看积分余额
    GET
  1. AI桌面助手 V1 AI角色

AI桌面助手V5(Socket)

开发中
POST
https://api.mindcraft.com.cn

链接socket + 认证#

步骤说明:① 先建立 WebSocket 连接 → ② 选择一种方式完成认证 → ③ 认证成功后即可调用 desktop_assistant_v5
建立websocket链接
ApiKey认证
DeviceToken认证

智能体 desktop_assistant_v5#

标准聊天
拍照识图
拍照答题
停止语音上传
终止流体返回数据

通用参数说明#

参数类型必填说明
agent_namestring是固定为 desktop_assistant_v5
asr_textstring否语音识别文字,视觉模式下可为空
session_tokenstring否会话 token,有历史记录时必填
tts_modelstring否TTS 模型,默认 MM_TTSL_realtime_speech-01-turbo
llm_modelstring否LLM 模型,默认 qwen-turbo-latest
agent_functionobject否智能体功能控制,见下方说明
vision_modestring否视觉模式:image_recognize 或 image_qa
image_datastring/list否图片 base64,视觉模式必填

agent_function 参数#

status行为
on(默认)全部能力开放,LLM 自动判断
off强制 chat,跳过 LLM 判断
partial只开放 enabled_function 白名单,或排除 disabled_function 黑名单

socket 返回示例说明#

聊天场景
场景通知
聊天-情绪+文字+音频
结束对话
{
    "socket_status": 1007,
    "socket_message": "agent_event",
    "socket_type": "agent_event",
    "event_name": "agent_action",
    "socket_data": {
        "agent_type": "chat",
        "agent_name": "desktop_assistant_v5"
    }
}
没有 agent_output 表示场景通知,agent_type 为 chat 表示接下来进行文本对话。
拍照识图(image_recognize)
拍照答题(image_qa)
天气查询
闹钟/倒计时/系统设置

请求参数

Body 参数application/json

请求示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location 'https://api.mindcraft.com.cn' \
--header 'Content-Type: application/json' \
--data '{
    "socket_type": "agent_event",
    "event_name": "agent_action",
    "event_params": {
        "agent_name": "desktop_assistant_v5",
        "asr_text": "string",
        "session_token": "string",
        "tts_model": "MM_TTSL_realtime_speech-01-turbo",
        "llm_model": "qwen-turbo-latest",
        "vision_mode": "image_recognize",
        "image_data": "string",
        "agent_function": {
            "status": "on",
            "enabled_function": [
                "string"
            ],
            "disabled_function": [
                "string"
            ]
        },
        "token": "string"
    }
}'

返回响应

🟢200成功
application/json
Bodyapplication/json

示例
{}
修改于 2026-04-18 04:32:27
上一页
AI桌面助手V1(Socket)
下一页
device 获取token
Built with