价格体系
余额按量计费 · 按模型实际 token 消耗扣费 · 以已上架模型价格为准。
计费原则
- 只走钱包余额:当前账户下所有 API Key、Playground 调用都从同一个钱包扣费。
- 按 token 实时结算:请求成功后根据 usage 中的
prompt_tokens+completion_tokens计算费用。 - 失败不计费:上游返回错误、本地校验失败、余额不足或未选中上游时不扣费。
- 流式也按实际完成量结算:SSE 结束后结算;连接中断时按已产生的 token 结算。
定价公式
text
本次费用 = prompt_tokens * input_price_per_1k / 1000
+ completion_tokens * output_price_per_1k / 1000
input_price_per_1k / output_price_per_1k 是平台售卖价(元 / 千 token)。 在 Console 的 模型 & 定价 页面可以查看当前可用模型和实时价格。
余额不足时的行为
Router 会先冻结一小笔预估金额,请求结束后再按实际费用扣减并释放剩余冻结金额。 如果钱包余额不足,请求会在转发到上游前被拒绝,避免产生不可控欠费。
主要模型参考价
下表是示例价格,实际价格以 模型页面或
GET /v1/models/pricing 返回的数据为准;分组不是当前公开价格接口的稳定字段。| 模型 | 厂商 | 上下文 | 输入(元 / 1K) | 输出(元 / 1K) |
|---|---|---|---|---|
aliyun/qwen-max | 阿里百炼 | 32K | 0.02 | 0.06 |
aliyun/qwen-plus | 阿里百炼 | 128K | 0.004 | 0.012 |
aliyun/deepseek-r1 | DeepSeek | 128K | 0.001 | 0.002 |
doubao-1.5-pro-32k | 火山方舟 | 32K | 0.0008 | 0.002 |
tencent/hunyuan-turbo | 腾讯混元 | 32K | 0.015 | 0.05 |
充值与对账
- 钱包余额可以在 账单 & 充值 页面充值,余额不会按月清零。
- 每次扣费都会写入交易流水,方便按 API Key、模型和时间范围对账。
- 可以设置低余额提醒,避免生产调用因为余额不足中断。