AI桌面助手V5(Socket)

链接socket + 认证

步骤说明：① 先建立 WebSocket 连接 → ② 选择一种方式完成认证 → ③ 认证成功后即可调用 desktop_assistant_v5

建立websocket链接

ApiKey认证

DeviceToken认证

智能体 desktop_assistant_v5

标准聊天

拍照识图

拍照答题

停止语音上传

终止流体返回数据

通用参数说明

参数	类型	必填	说明
agent_name	string	是	固定为 desktop_assistant_v5
asr_text	string	否	语音识别文字，视觉模式下可为空
session_token	string	否	会话 token，有历史记录时必填
tts_model	string	否	TTS 模型，默认 MM_TTSL_realtime_speech-01-turbo
llm_model	string	否	LLM 模型，默认 qwen-turbo-latest
agent_function	object	否	智能体功能控制，见下方说明
vision_mode	string	否	视觉模式：image_recognize 或 image_qa
image_data	string/list	否	图片 base64，视觉模式必填

agent_function 参数

status	行为
on（默认）	全部能力开放，LLM 自动判断
off	强制 chat，跳过 LLM 判断
partial	只开放 enabled_function 白名单，或排除 disabled_function 黑名单

socket 返回示例说明

聊天场景

场景通知

聊天-情绪+文字+音频

结束对话

{
    "socket_status": 1007,
    "socket_message": "agent_event",
    "socket_type": "agent_event",
    "event_name": "agent_action",
    "socket_data": {
        "agent_type": "chat",
        "agent_name": "desktop_assistant_v5"
    }
}

没有 agent_output 表示场景通知，agent_type 为 chat 表示接下来进行文本对话。

拍照识图（image_recognize）

拍照答题（image_qa）

天气查询

闹钟/倒计时/系统设置

请求参数

Body 参数application/json

示例

{
    "socket_type": "agent_event",
    "event_name": "agent_action",
    "event_params": {
        "agent_name": "desktop_assistant_v5",
        "asr_text": "string",
        "session_token": "string",
        "tts_model": "MM_TTSL_realtime_speech-01-turbo",
        "llm_model": "qwen-turbo-latest",
        "vision_mode": "image_recognize",
        "image_data": "string",
        "agent_function": {
            "status": "on",
            "enabled_function": [
                "string"
            ],
            "disabled_function": [
                "string"
            ]
        },
        "token": "string"
    }
}

请求示例代码

Shell

JavaScript

Java

Swift

PHP

Python

HTTP

Objective-C

Ruby

OCaml

Dart

AI桌面助手V5(Socket)

链接socket + 认证#

智能体 desktop_assistant_v5#

通用参数说明#

agent_function 参数#

socket 返回示例说明#