常见问题

按使用阶段分类 —— 从接入到结算,挑你关心的看。

注册与账户

注册需要什么资料?

注册必须填写账户名、手机号、短信验证码和密码,并通过 Turnstile 人机验证。邮箱当前不在注册页面展示;后续如需绑定邮箱,可在账户设置中维护。

可以多人共用一个账户吗?

不推荐。当前版本采用单账户 + 多 API Key 模型:建议按环境或服务拆分 Key, 用 Key 的过期时间、速率限制、Token 上限和预算上限控制风险。审计日志记录当前账号自己的重要操作。

注册后有免费额度吗?

当前采用余额按量计费,不再按月赠送固定 token。注册后可以先充值小额余额, 再用 API Key 或 Playground 验证上游模型。

接入与调用

我的代码可以直接从 OpenAI 切过来吗?

可以。Swarmix 兼容 OpenAI /v1/chat/completions 调用方式。通常只需改 2 处:api_keybase_url。高级参数、多模态输入和模型能力以具体厂商文档为准。 详细步骤见 OpenAI SDK 集成指南

能同时调用多个厂商的模型吗?

可以。把 model 参数换成对应的模型 ID 即可。同一把 API Key 可以自由调用平台上所有你有权限的模型。

支持 Embedding / 图像生成 / TTS 吗?

目前只支持 Chat Completions。Embedding / Image / Audio / Video 在路线图上。

为什么我请求失败了但日志里没显示?

请求必须通过鉴权层(有效 Key)才会进入请求日志。如果连 401 都拿到,说明 Key 错了。检查:

  • Key 有没有拷贝完整(sk-swx- 开头,长度 32+)
  • 在 Console → API Keys 里 Key 是不是仍显示为"活跃"
  • base URL 是不是 /v1 结尾

计费与账单

token 怎么计算?

严格按照 OpenAI tokenizer 的结果。每次响应的 usage 字段返回准确的 prompt_tokens / completion_tokens。Swarmix 按这两个数字 × 单价扣款。

我没有调用成功也扣款了吗?

不会。上游返回 4xx/5xx 或当前模型没有可用上游候选时,0 扣款。 有一种例外:流式请求已经返回部分 token,此时按实际已产生的 token 结算。

为什么余额扣了但日志里看不到?

ClickHouse 的请求明细有 1-2 秒的延迟。MySQL 的交易流水是实时的。可以在账单 & 充值 页查 transactions 表,那里立即能看到扣款。

可以开发票吗?

当前 Console 已提供充值和交易流水查询。发票流程尚未做成自助页面,如需开票请通过工单提交公司抬头、税号和充值记录。

故障与排障

请求 504 超时怎么办?

上游厂商偶发。Swarmix 会按当前 retry 策略做有限重试,仍失败则透传给客户端。客户端侧建议实现指数退避重试 —— 见 重试最佳实践

流式响应卡在某个位置不动了?

通常是上游模型的 TTFT(首 token)还没到,或正在"思考"。给客户端设合理的读超时(建议 30-60s), 命中后当作失败重试。长推理模型(deepseek-reasoner)可能首 token 要 5-15 秒。

返回结果和 OpenAI 不一样?

Swarmix 路由到的是国产厂商模型,能力和风格会有差异。建议:

  • 调 temperature / top_p 适应国产模型风格
  • prompt 增加明确的格式约束(国产模型更吃 few-shot)
  • 用 deepseek-reasoner 替代需要复杂推理的场景

安全

我的 API Key 泄露了怎么办?

立即去 Console 删除。 5 分钟内全球所有副本失效。查审计日志确认泄露期间的异常请求,如有异常扣款发工单申诉。

Swarmix 会看到我的 prompt 内容吗?

内容会经过平台的请求链路(审核模块可选,需主动开启),但不会被记录到长期存储里用于任何训练或分析。 原始请求日志只保留 90 天用于故障排查,长期趋势使用聚合统计;请求体只在 debug 模式下保留摘要。具体见隐私政策

可以关闭内容审核吗?

内容审核属于平台侧可选安全模块,是否启用取决于当前部署配置。当前客户 Console 不提供自助开关; 如需调整策略请提交工单。