价格体系

余额按量计费 · 按模型实际 token 消耗扣费 · 以已上架模型价格为准。

计费原则

  • 只走钱包余额:当前账户下所有 API Key、Playground 调用都从同一个钱包扣费。
  • 按 token 实时结算:请求成功后根据 usage 中的 prompt_tokens + completion_tokens 计算费用。
  • 失败不计费:上游返回错误、本地校验失败、余额不足或未选中上游时不扣费。
  • 流式也按实际完成量结算:SSE 结束后结算;连接中断时按已产生的 token 结算。

定价公式

text
本次费用 = prompt_tokens     * input_price_per_1k  / 1000
         + completion_tokens * output_price_per_1k / 1000

input_price_per_1k / output_price_per_1k 是平台售卖价(元 / 千 token)。 在 Console 的 模型 & 定价 页面可以查看当前可用模型和实时价格。

余额不足时的行为
Router 会先冻结一小笔预估金额,请求结束后再按实际费用扣减并释放剩余冻结金额。 如果钱包余额不足,请求会在转发到上游前被拒绝,避免产生不可控欠费。

主要模型参考价

下表是示例价格,实际价格以 模型页面GET /v1/models/pricing 返回的数据为准;分组不是当前公开价格接口的稳定字段。
模型厂商上下文输入(元 / 1K)输出(元 / 1K)
aliyun/qwen-max阿里百炼32K0.020.06
aliyun/qwen-plus阿里百炼128K0.0040.012
aliyun/deepseek-r1DeepSeek128K0.0010.002
doubao-1.5-pro-32k火山方舟32K0.00080.002
tencent/hunyuan-turbo腾讯混元32K0.0150.05

充值与对账

  • 钱包余额可以在 账单 & 充值 页面充值,余额不会按月清零。
  • 每次扣费都会写入交易流水,方便按 API Key、模型和时间范围对账。
  • 可以设置低余额提醒,避免生产调用因为余额不足中断。