响应接口

OpenAI Responses API 的 text-only 兼容层。适合使用新版 OpenAI SDK 的客户，底层仍走 Swarmix 的统一路由与计费链路。

POST/v1/responses

/v1/responses 是 /v1/chat/completions 之上的兼容封装：input 会转换为用户消息，instructions 会转换为 system message，然后复用同一套模型与厂商路由、鉴权、钱包预扣、失败候选处理、计费和日志。

当前支持范围

当前版本支持文本输入和非流式输出。stream=true、图片/音频输入、托管工具、持久 conversation state 暂未开放；需要流式响应时请继续使用 /v1/chat/completions。

与对话补全的关系

能力	对话补全	响应接口
端点	`/v1/chat/completions`	`/v1/responses`
输入	`messages`	`input` + `instructions`
底层执行	直接进入 Router pipeline	转换为 Chat Completions 后进入同一 pipeline
推荐场景	兼容 Dify、Cursor、ChatBox、旧 OpenAI SDK	兼容新版 OpenAI SDK 的 `client.responses.create()`

请求头

Header	必填	示例	说明
`Authorization`	是	`Bearer sk-swx-xxx`	Swarmix 签发的 API Key
`Content-Type`	是	`application/json`	请求体格式

请求体

字段	类型	必填	说明
`model`	string	是	要调用的模型 ID，例如 `aliyun/qwen-max`、`aliyun/deepseek-r1`。
`input`	string \| array	是	文本输入。数组形式会提取其中的文本 item，并转换为 messages。
`instructions`	string		系统级指令，会映射为 Chat Completions 的 system message。
`max_output_tokens`	integer		映射为 `max_tokens`。
`temperature`	number		采样温度，默认 1。
`stream`	boolean		当前暂不支持 `true`。

curl http://router.swarmixtoken.com/v1/responses \ -H "Authorization: Bearer sk-swx-xxxxxxxxxxxxxxxxxxxx" \ -H "Content-Type: application/json" \ -d '{ "model": "aliyun/qwen-max", "input": "用三句话解释什么是光合作用。", "instructions": "用简洁中文回答。", "max_output_tokens": 512 }'

{ "id": "resp_chatcmpl-example", "object": "response", "created_at": 1718000000, "status": "completed", "background": false, "error": null, "incomplete_details": null, "instructions": "用简洁中文回答。", "max_output_tokens": 512, "model": "aliyun/qwen-max", "output": [ { "id": "msg_chatcmpl-example", "type": "message", "status": "completed", "role": "assistant", "content": [ { "type": "output_text", "text": "光合作用是植物利用光能，把二氧化碳和水转化为有机物并释放氧气的过程。", "annotations": [] } ] } ], "output_text": "光合作用是植物利用光能，把二氧化碳和水转化为有机物并释放氧气的过程。", "parallel_tool_calls": true, "previous_response_id": null, "reasoning": { "effort": null, "summary": null }, "store": true, "temperature": null, "text": { "format": { "type": "text" } }, "tool_choice": null, "tools": [], "top_p": null, "truncation": null, "usage": { "input_tokens": 18, "input_tokens_details": { "cached_tokens": 0 }, "output_tokens": 20, "output_tokens_details": { "reasoning_tokens": 0 }, "total_tokens": 38 } }