响应接口
OpenAI Responses API 的 text-only 兼容层。适合使用新版 OpenAI SDK 的客户,底层仍走 Swarmix 的统一路由与计费链路。
POST
/v1/responses/v1/responses 是 /v1/chat/completions 之上的兼容封装:input 会转换为用户消息,instructions 会转换为 system message, 然后复用同一套模型与厂商路由、鉴权、钱包预扣、失败候选处理、计费和日志。
当前支持范围
当前版本支持文本输入和非流式输出。
stream=true、图片/音频输入、托管工具、 持久 conversation state 暂未开放;需要流式响应时请继续使用 /v1/chat/completions。与对话补全的关系
| 能力 | 对话补全 | 响应接口 |
|---|---|---|
| 端点 | /v1/chat/completions | /v1/responses |
| 输入 | messages | input + instructions |
| 底层执行 | 直接进入 Router pipeline | 转换为 Chat Completions 后进入同一 pipeline |
| 推荐场景 | 兼容 Dify、Cursor、ChatBox、旧 OpenAI SDK | 兼容新版 OpenAI SDK 的 client.responses.create() |
请求头
| Header | 必填 | 示例 | 说明 |
|---|---|---|---|
Authorization | 是 | Bearer sk-swx-xxx | Swarmix 签发的 API Key |
Content-Type | 是 | application/json | 请求体格式 |
请求体
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
model | string | 是 | 要调用的模型 ID,例如 aliyun/qwen-max、aliyun/deepseek-r1。 |
input | string | array | 是 | 文本输入。数组形式会提取其中的文本 item,并转换为 messages。 |
instructions | string | 系统级指令,会映射为 Chat Completions 的 system message。 | |
max_output_tokens | integer | 映射为 max_tokens。 | |
temperature | number | 采样温度,默认 1。 | |
stream | boolean | 当前暂不支持 true。 |