GenStudio 预计于 2025 年 5 月 推出 GenStudio 高级版/企业版升级服务,可付费调用预置 LLM API,GenStudio 预计于 2025 年 5 月 推出 GenStudio 高级版/企业版升级服务,可付费调用预置 LLM API, ,大幅提升 API 调用频率查看预告
Skip to content

API 服务等级与计费规则

预置 LLM API 服务采用按量计费方式。本文档详细说明了预置 LLM API 服务的免费场景、计费规则、使用限制及费用查看方式。

DANGER

上线预告:GenStudio 预计于 2025 年 5 月 推出 GenStudio 高级版/企业版升级服务,可付费调用预置 LLM API,并可大幅提升 API 调用频率上限。

  • 在此之前,预置 LLM API 仍全面免费,遵循旧版 API 频率限制
  • 您可以通过本文提前了解即将推出的 GenStudio 免费版/高级版/企业版服务。

服务等级

租户在 GenStudio 的服务等级决定了 API 调用是否计费,以及享受的 API 频率上限。

  • 基础服务:RPM=12、RPD=3000、TPM=12000;默认情况下,租户均享受基础服务。基础服务不计费。
  • 高级服务:RPM=120、RPD 不限、TPM=120000;租户可选择升级服务,享受更高限频。高级服务根据实际 Token 用量进行后付费结算。
  • 企业服务:如果高级服务无法满足您的需求,欢迎联系我们,我们将根据您的实际用量和合作情况提供个性化方案。企业服务根据实际 Token 用量进行后付费结算,或按合同约定方式计费。

免费场景

租户在 GenStudio 的服务等级为基础服务时,可免费使用预置 LLM API 服务。

免费场景还包括以下情况(与服务等级无关):

  • GenStudio 体验中心暂不计费。
  • 嵌入模型与重排序模型暂不收费。

计费场景

租户已升级为高级服务、企业服务。调用平台预置大语言模型 API 接口,根据实际 Token 用量进行后付费结算。

NOTE

其他情形,请联系无问芯穹咨询具体收费规则。

查询单价

前往大模型服务平台的模型广场,选择模型卡片,查看输入与输出价格。如租户享受折扣,此处展示折后价。

计费细则

  • 按 Token 用量计费:从您发起 API 调用开始,至平台返回结果为止,实际消耗的 Token 数量(分为输入 Token 和输出 Token)计入计费。
    • 示例:若一次调用消耗 500 个输入 Token 和 300 个输出 Token,总计 800 Token,其中 500 个 Token 按输入单价计费,300 个 Token 按输出单价计费。
  • 首次调用模型时,生成新的后付费订单。
  • 采用后付费模式,每自然小时生成明细账单,结算并扣费。
  • 优先使用代金券抵扣,超出部分从账户余额扣除。
  • 金额计算单位为元,精度为小数点后 6 位(如 ¥0.000765)。
  • Token 用量计算单位为个,精度为整数(如 1024 Token)。
  • 每自然小时统计累计 Token 用量,计算费用,不单独计算单次调用费用。
  • 超出计费精度处理:按账期扣费时,累计金额向下取整至小数点后 6 位。

特殊情况

  • 如因内容审核触发拦截,或用户主动终止请求,或超过 Max Tokens 导致回复被截断,当次请求的输入输出 Token 消耗计入总用量。
  • 平台按小时扣费,如果发生欠费时请求尚未终止,将继续完成请求。下次充值时,将首先补缴上次欠款额度。
  • 如果低余额情况下调用量激增,可能触发平台即时结算并扣费。请随时关注您的余额,避免低余额或欠费影响业务稳定性。

费用查看

智算云平台费用中心提供租户的流水、充值入口及所有服务的订单、月账单、明细等信息。

查看实时费用

每个自然小时结束后统计过去一小时内 API 调用费用,生成账单明细。

NOTE

API 调用不会立即结算单次调用费用。仅支持按小时查看账单。

查看明细账单

访问费用中心账单页面,切换至「明细账单」,产品名为「预置服务按量在线调用」,相关的规格为模型名称,例如 qwen2.5-14b-instruct

  • 每个自然小时结束后生成账单明细,加入当前自然月月账单。
  • 计费公式:每自然小时累计 Token 用量 × 单价。
  • 所有时间均为北京时间 (UTC+8)。

查看月度账单

访问费用中心账单页面,切换至「月账单」,查看当月累计总消费额、余额消费情况及可开票金额。月账单包含租户所有服务费用。

欠费处理

平台暂不支持低余额告警,请及时关注账户余额,避免因欠费影响业务。

停用功能

欠费时无法使用以下功能:

  • 通过 API 调用预置 LLM 服务。

欠费错误提示

  • API 返回 HTTP 402 错误,返回相应内部返回错误码 10007。

恢复服务

  • 充值补足欠费金额。
  • 余额为正时自动恢复,无需人工操作(可能需等待约 5 分钟)。

常见问题

如何查看 Token 用量情况?

用量统计页面可查看 API Token 用量,记录时间为北京时间 (UTC+8)。用量统计页面不展示具体费用。

任务失败是否收费?

是的,按实际消耗 Token 量收费。若因平台故障导致失败,可联系客服申请补偿。

是否支持消费限额或预算告警?

暂不支持,建议定期检查余额。

是否有优惠套餐?

暂无线上套餐,大规模使用可联系无问芯穹洽谈。

对账单有疑问如何处理?

请联系无问芯穹,我们将核对记录并及时处理。