AIStudio SSH 公钥管理,一处配置,处处可用AIStudio SSH 公钥管理,一处配置,处处可用 ,只为更佳开发体验如何配置
Skip to content

GenStudio 价格

提供开箱即用的预置模型 API 服务,也可轻松完成模型微调任务。微调后的模型或预置模型均可部署至专用实例。

立即使用 GenStudio

推理服务

通过 GenStudio 大模型服务 API 可以使用多种领先的开源和闭源大语言模型。对于这些模型,您只需按实际使用量付费。

预置推理服务

直接调用 GenStudio 预部署的大模型 API 服务,无需自行部署模型。采用后付费模式,每小时出账。按量计费,价格单位为每千个 Token,包括大语言模型的输入和输出 Token。

预置推理 API 服务按模型的参数量级,采用分层定价。计价单位:元/千 Token。

  • DeepSeek 系列

    • 参数量级

      模型

      输入/输出(元/千 Token)

    • 31-60B

      deepseek-r1-distill-qwen-32b

      0.002 / 0.002

    • 100B+

      deepseek-r1deepseek-v3pro-deepseek-v3

      0.004 / 0.0160.002 / 0.0080.002 / 0.008

  • Qwen 系列

    • 参数量级

      模型

      输入/输出(元/千 Token)

    • 1-10B

      qwen2-7b-instructqwen2.5-7b-instruct

      0.001 / 0.0010.001 / 0.001

    • 11-30B

      qwen1.5-14b-chatqwen2.5-14b-instruct

      0.002 / 0.0020.002 / 0.002

    • 31-60B

      qwen1.5-32b-chatqwen2.5-32b-instructqwen2.5-coder-32b-instructqwen2.5-vl-32b-instructqwq-32b-previewqwq-32b

      0.0029 / 0.00290.0029 / 0.00290.0029 / 0.00290.0058 / 0.0580.0029 / 0.00290.0029 / 0.0029

    • 61-100B

      qwen1.5-72b-chatqwen2-72b-instructqwen2.5-72b-instruct

      0.005 / 0.0050.005 / 0.0050.005 / 0.005

  • LLaMA 系列

    • 参数量级

      模型

      输入/输出(元/千 Token)

    • 1-10B

      llama-3-8b-instructllama-3-infini-8b-instruct

      0.001 / 0.0010.001 / 0.001

    • 61-100B

      llama-3.1-70b-instructllama-3.3-70b-instruct

      0.005 / 0.0050.005 / 0.005

  • 智谱系列

    • 参数量级

      模型

      输入/输出(元/千 Token)

    • 1-10B

      chatglm3-6b-baseglm-4-9b-chat

      0.001 / 0.0010.001 / 0.001

    • 31-60B

      chatglm3

      0.0029 / 0.0029

  • 其他语言模型

    • 参数量级

      模型

      输入/输出(元/千 Token)

    • 1-10B

      megrez-3b-instruct

      限时免费

    • 11-30B

      gemma-2-27b-it

      0.0029 / 0.0029

    • 31-60B

      yi-1.5-34b-chat

      0.0029 / 0.0029

  • 嵌入模型

    • 参数量级

      模型

      输入/输出(元/千 Token)

    • 1-10B

      bge-m3jina-embeddings-v2-base-codejina-embeddings-v2-base-zh

      限时免费限时免费限时免费

  • 重排序模型

    • 参数量级

      模型

      输入/输出(元/千 Token)

    • 1-10B

      bge-reranker-v2-m3

      限时免费

NOTE

当前针对 API Key 设置了 RPM(每分钟请求数)、RPM(每天请求数)、TPM(每分钟 Token 数量)限制。具体限制可参考 API 限频。如需提升,可联系售后。

自部署 LoRA 模型

直接上传 LoRA 文件,并指定基础模型,即可为不同业务场景的部署专属推理服务。按模型的参数量级,采用分层定价。计价单位:元/千 Token。

  • Qwen 系列

    • 厂商

      模型

      输入/输出(元/千 Token)

    • 阿里云

      qwen1.5-14b-chat

      0.0035 / 0.0035

    • 阿里云

      qwen2-7b-instruct

      0.0016 / 0.0016

    • 阿里云

      qwen2.5-14b-instruct

      0.0035 / 0.0035

    • 阿里云

      qwen2.5-32b-instruct

      0.0049 / 0.0049

    • 阿里云

      qwen2.5-7b-instruct

      0.0016 / 0.0016

模型微调

GenStudio 提供预置模型微调服务,帮助您快速创建适合特定任务的定制化模型。上传业务数据集,选择预置的⼤模型和微调⽅式,即可发起微调任务。

模型微调服务

微调费用取决于模型大小、数据集大小和 epoch 数。GenStudio 按微调服务使用 Token 数量计费(训练数据 ✕ 迭代轮次)。微调任务完成后出账。

  • Qwen 系列

    • 厂商

      模型

      价格

    • 阿里云

      qwen1.5-14b-chat

      限时免费

    • 阿里云

      qwen1.5-7b-chat

      限时免费

    • 阿里云

      qwen2-7b

      限时免费

  • LLaMA 系列

    • 厂商

      模型

      价格

    • Meta

      llama-2-7b-chat

      限时免费

NOTE

平台限制了每个账号最多可同时运行的微调任务数。若已到达上限,请耐心等待微调任务完成后重试。

费用中心

清晰的余额、账单与流水信息,让您无忧无虑。

访问费用中心

NOTE

  • 当账户被扣为负值时,说明账户已欠费。请及时充值偿付欠款,以免影响您的正常使用。
  • 账号欠费后 1 小时内补缴所有欠费账单的,可正常使用平台大模型服务。欠费后 1 小时仍未能补缴所有欠费账单的,将关停账号下所有相关模型服务。