在 AIStudio 镜像中心使用 Dockerfile 自助构建最新版 vLLM 镜像在 AIStudio 镜像中心使用 Dockerfile 自助构建最新版 vLLM 镜像 ,无需访问 DockerHub立即构建
Skip to content

GenStudio 价格

提供开箱即用的预置模型 API 服务,也可轻松完成模型微调任务。微调后的模型或预置模型均可部署至专用实例。

查看 GenStudio API 服务价目表

推理服务

通过 GenStudio 大模型服务 API 可以使用多种领先的开源和闭源大语言模型,或使用自部署的模型 API 服务。

预置模型推理服务 - 按量计费

预置模型指由模型厂商发布、平台预先集成并由平台托管与维护的模型,您可以直接调用 API,无需自行部署模型。预置模型会不定期更新,模型列表以模型广场展示为准。

预置推理 API 服务按模型的参数量级,采用分层定价。计价单位:元/千 Token。基础版费用全免,仅高级版/企业版按量计费。后付费模式,每小时出账。大语言模型的输入和输出分别定价。

注意

当前针对 API Key 设置了 RPM(每分钟请求数)、RPM(每天请求数)、TPM(每分钟 Token 数量)限制。具体限制可参考 API 限频。如需提升,可联系售后。

预置模型推理服务 - 包并发

包并发计费模式适合要求业务稳定性、或对预算管理有强诉求的客户。客户按并发数采购,在购买的并发数量内的 API 请求高优处理,享受类似专属实例的体验,但更实惠的价格。

包并发模式下,客户按并发数采购,成本可控。仅部分预置推理 API 服务支持包并发计费模式。采购单位:元/每并发请求数。如需采购,可请联系商务。

注意

  • 推理服务请求需要一定的推理时长。并发数量是指线上同时处理中、尚未完成返回的 API 请求数。
  • 如果线上同时处理的 API 请求超过您采购的并发数量,可设置为直接拒绝;等待并发数量空闲后再次请求,适合需要控制预算的场景。建议您根据历史业务流量采购合适的并发数量,并随时调整。
  • 也可设置超量请求转为按量计费,优先保障服务连续性。
  • 当前针对 API Key 设置了 RPM(每分钟请求数)、RPM(每天请求数)、TPM(每分钟 Token 数量)限制。具体限制可参考 API 限频。如需提升,可联系售后。

GenStudio API 服务价目表

大语言模型、视觉语言模型、视频模型 API 收费标准(按 Token 计费 + 包并发服务)。

查看 API 服务价目表

模型微调

GenStudio 提供预置模型微调服务,帮助您快速创建适合特定任务的定制化模型。上传业务数据集,选择预置的⼤模型和微调⽅式,即可发起微调任务。

模型微调服务

微调费用取决于模型大小、数据集大小和 epoch 数。GenStudio 按微调服务使用 Token 数量计费(训练数据 ✕ 迭代轮次)。微调任务完成后出账。
  • Qwen 系列

    • 厂商

      模型

      价格

    • 阿里云

      qwen1.5-7b-chat

      限时免费

    • 阿里云

      qwen2-7b

      限时免费

  • LLaMA 系列

    • 厂商

      模型

      价格

    • Meta

      llama-2-7b-chat

      限时免费

注意

本功能仅向企业级客户授权开放。非授权客户无功能入口。如需使用,请联系商务或售后服务。

费用中心

清晰的余额、账单与流水信息,让您无忧无虑。

访问费用中心

注意

当账户被扣为负值时,说明账户已欠费。请及时充值偿付欠款,以免影响您的正常使用。