GenStudio 于 2025 年 5 月 推出 GenStudio 高级版/企业版升级服务,大幅提升 API 调用频率GenStudio 于 2025 年 5 月 推出 GenStudio 高级版/企业版升级服务,大幅提升 API 调用频率 ,依然保留免费基础服务了解计费
Skip to content

GenStudio 价格

提供开箱即用的预置模型 API 服务,也可轻松完成模型微调任务。微调后的模型或预置模型均可部署至专用实例。

查看 GenStudio 价目表

推理服务

通过 GenStudio 大模型服务 API 可以使用多种领先的开源和闭源大语言模型,或使用自部署的模型 API 服务。

预置模型推理服务 - 按量计费

预置模型指由模型厂商发布、平台预先集成并由平台托管与维护的模型,您可以直接调用 API,无需自行部署模型。预置模型会不定期更新,模型列表以模型广场展示为准。

预置推理 API 服务按模型的参数量级,采用分层定价。计价单位:元/千 Token。基础版费用全免,仅高级版/企业版按量计费。后付费模式,每小时出账。大语言模型的输入和输出分别定价。

注意

当前针对 API Key 设置了 RPM(每分钟请求数)、RPM(每天请求数)、TPM(每分钟 Token 数量)限制。具体限制可参考 API 限频。如需提升,可联系售后。

预置模型推理服务 - 包并发

包并发计费模式适合要求业务稳定性、或对预算管理有强诉求的客户。客户按并发数采购,在购买的并发数量内的 API 请求高优处理,享受类似专属实例的体验,但更实惠的价格。

包并发模式下,客户按并发数采购,成本可控。仅部分预置推理 API 服务支持包并发计费模式。采购单位:元/每并发请求数。如需采购,可请联系商务。

注意

  • 推理服务请求需要一定的推理时长。并发数量是指线上同时处理中、尚未完成返回的 API 请求数。
  • 如果线上同时处理的 API 请求超过您采购的并发数量,可设置为直接拒绝;等待并发数量空闲后再次请求,适合需要控制预算的场景。建议您根据历史业务流量采购合适的并发数量,并随时调整。
  • 也可设置超量请求转为按量计费,优先保障服务连续性。
  • 当前针对 API Key 设置了 RPM(每分钟请求数)、RPM(每天请求数)、TPM(每分钟 Token 数量)限制。具体限制可参考 API 限频。如需提升,可联系售后。

自部署 LoRA 模型

直接上传 LoRA 文件,并指定基础模型,即可为不同业务场景的部署专属推理服务。按模型的参数量级,采用分层定价。计价单位:元/千 Token。
  • Qwen 系列

    • 厂商

      模型

      输入/输出(元/百万 Token)

    • 阿里云

      qwen1.5-14b-chat

      3.5

    • 阿里云

      qwen2.5-14b-instruct

      3.5

    • 阿里云

      qwen2.5-32b-instruct

      4.9

    • 阿里云

      qwen2.5-7b-instruct

      1.6

    • 阿里云

      qwen2-7b-instruct

      1.6

模型微调

GenStudio 提供预置模型微调服务,帮助您快速创建适合特定任务的定制化模型。上传业务数据集,选择预置的⼤模型和微调⽅式,即可发起微调任务。

模型微调服务

微调费用取决于模型大小、数据集大小和 epoch 数。GenStudio 按微调服务使用 Token 数量计费(训练数据 ✕ 迭代轮次)。微调任务完成后出账。
  • Qwen 系列

    • 厂商

      模型

      价格

    • 阿里云

      qwen1.5-7b-chat

      限时免费

    • 阿里云

      qwen2-7b

      限时免费

  • LLaMA 系列

    • 厂商

      模型

      价格

    • Meta

      llama-2-7b-chat

      限时免费

注意

平台限制了每个账号最多可同时运行的微调任务数。若已到达上限,请耐心等待微调任务完成后重试。

费用中心

清晰的余额、账单与流水信息,让您无忧无虑。

访问费用中心

注意

当账户被扣为负值时,说明账户已欠费。请及时充值偿付欠款,以免影响您的正常使用。