Skip to content

GenStudio 价格

提供开箱即用的预置模型 API 服务,也可轻松完成模型微调任务。微调后的模型或预置模型均可部署至专用实例。

立即使用 GenStudio

推理服务

通过 GenStudio 大模型服务 API 可以使用多种领先的开源和闭源大语言模型。对于这些模型,您只需按实际使用量付费。

预置推理服务

直接调用 GenStudio 预部署的大模型 API 服务,无需自行部署模型。采用后付费模式,每小时出账。按量计费,价格单位为每千个 Token,包括大语言模型的输入和输出 Token。

预置推理 API 服务按模型的参数量级,采用分层定价。

  • 大语言模型

    • 参数量级

      模型

      价格

    • 1-10B

      baichuan2-7b-chatchatglm2-6b-32kchatglm2-6bchatglm3-6b-32kchatglm3-6b-basechatglm3-6bgemma-7bgemma-1.1-7b-itglm-4-9b-chatmt-infini-3binfini-megrez-7bllama-2-7b-chatllama-3-8b-instructllama-3-infini-8b-instructqwen-7b-chatqwen1.5-7b-chatqwen2-7b-instructqwen2-7b

      限时免费

    • 11-30B

      baichuan2-13b-basebaichuan2-13b-chatllama-2-13b-chatqwen-14b-chatqwen1.5-14b-chat

      限时免费

    • 31-60B

      chatglm3qwen1.5-32b-chatyi-34b-chat

      限时免费

    • 61-100B

      llama-2-70b-chatllama-2-70bllama-3-70b-instructqwen-72b-chatqwen1.5-72b-chatqwen1.5-72bqwen2-72b-instruct

      限时免费

    • 100B+

      dbrx-instruct

      限时免费

NOTE

当前针对 API Key 设置了 RPM(每分钟请求数)、RPM(每天请求数)、TPM(每分钟 Token 数量)限制。具体限制可参考 API 限频。如需提升,可联系售后。

自部署模型服务

使用独占实例托管您的模型时,您需要按分钟支付独占 GPU 实例的费用。直接部署预置第三方模型,或部署通过 GenStudio 微调后的模型。我们将根据实际使用的算力和运行时长收取推理费用。

  • 大语言模型

    • 厂商

      模型

      价格

    • 百川智能

      baichuan2-13b-base

      ¥ 0.29 / 分钟

    • 百川智能

      baichuan2-7b-chat

      ¥ 0.1 / 分钟

    • 智谱 AI

      chatglm3-6b-base

      ¥ 0.1 / 分钟

    • Meta

      llama-2-7b-chat

      ¥ 0.1 / 分钟

    • Meta

      llama-3-8b-instruct

      ¥ 0.1 / 分钟

    • 阿里云

      qwen1.5-14b-chat

      ¥ 0.29 / 分钟

    • 阿里云

      qwen1.5-7b-chat

      ¥ 0.1 / 分钟

    • 阿里云

      qwen1.5-7b

      ¥ 0.1 / 分钟

模型微调

GenStudio 提供预置模型微调服务,帮助您快速创建适合特定任务的定制化模型。上传业务数据集,选择预置的⼤模型和微调⽅式,即可发起微调任务。

模型微调服务

微调费用取决于模型大小、数据集大小和 epoch 数。GenStudio 按微调服务使用 Token 数量计费(训练数据 ✕ 迭代轮次)。微调任务完成后出账。

  • 大语言模型

    • 厂商

      模型

      价格

    • 百川智能

      baichuan2-13b-base

      限时免费

    • 智谱 AI

      chatglm3-6b-base

      限时免费

    • Meta

      llama-2-7b-chat

      限时免费

    • Meta

      llama-3-8b-instruct

      限时免费

    • 阿里云

      qwen1.5-14b-chat

      限时免费

    • 阿里云

      qwen1.5-7b-chat

      限时免费

    • 阿里云

      qwen2-7b

      限时免费

NOTE

平台限制了每个账号最多可同时运行的微调任务数。若已到达上限,请耐心等待微调任务完成后重试。


NOTE

  • 当账户被扣为负值时,说明账户已欠费。请及时充值偿付欠款,以免影响您的正常使用。
  • 账号欠费后 1 小时内补缴所有欠费账单的,可正常使用平台大模型服务。欠费后 1 小时仍未能补缴所有欠费账单的,将关停账号下所有相关模型服务。