直接调用 GenStudio 预部署的大模型 API 服务,无需自行部署模型。采用后付费模式,每小时出账。按量计费,价格单位为每千个 Token,包括大语言模型的输入和输出 Token。
预置推理 API 服务按模型的参数量级,采用分层定价。
1-10B
bge-m3bge-reranker-v2-m3chatglm3-6b-baseglm-4-9b-chatjina-embeddings-v2-base-codejina-embeddings-v2-base-zhllama-3-8b-instructllama-3-infini-8b-instructmegrez-3b-instructqwen1.5-7b-chatqwen2-7b-instructqwen2.5-7b-instruct
限时免费
11-30B
gemma-2-27b-itqwen1.5-14b-chatqwen2.5-14b-instruct
限时免费
31-60B
chatglm3qwen1.5-32b-chatqwen2.5-32b-instructqwq-32b-previewyi-1.5-34b-chat
限时免费
61-100B
llama-3.1-70b-instructllama-3.3-70b-instructqwen1.5-72b-chatqwen2-72b-instructqwen2.5-72b-instruct
限时免费
1-10B
stable-diffusion-1.5
限时免费
1-10B
cogvideox-2b
限时免费
NOTE
当前针对 API Key 设置了 RPM(每分钟请求数)、RPM(每天请求数)、TPM(每分钟 Token 数量)限制。具体限制可参考 API 限频。如需提升,可联系售后。
使用独占实例托管您的模型时,您需要按分钟支付独占 GPU 实例的费用。直接部署预置第三方模型,或部署通过 GenStudio 微调后的模型。我们将根据实际使用的算力和运行时长收取推理费用。
百川智能
baichuan2-13b-base
¥ 0.29 / 分钟
百川智能
baichuan2-7b-chat
¥ 0.1 / 分钟
BAAI
bge-m3
¥ 0.1 / 分钟
BAAI
bge-reranker-v2-m3
¥ 0.1 / 分钟
智谱 AI
chatglm3-6b-base
¥ 0.1 / 分钟
Jina AI
jina-embeddings-v2-base-code
¥ 0.1 / 分钟
Jina AI
jina-embeddings-v2-base-zh
¥ 0.1 / 分钟
Meta
llama-2-7b-chat
¥ 0.1 / 分钟
Meta
llama-3-8b-instruct
¥ 0.1 / 分钟
Meta
llama-3.1-8b-instruct
¥ 0.1 / 分钟
阿里云
qwen1.5-14b-chat
¥ 0.29 / 分钟
阿里云
qwen1.5-4b-chat
¥ 0.1 / 分钟
阿里云
qwen1.5-7b-chat
¥ 0.1 / 分钟
阿里云
qwen1.5-7b
¥ 0.1 / 分钟
微调费用取决于模型大小、数据集大小和 epoch 数。GenStudio 按微调服务使用 Token 数量计费(训练数据 ✕ 迭代轮次)。微调任务完成后出账。
智谱 AI
chatglm3-6b-base
限时免费
Meta
llama-2-7b-chat
限时免费
阿里云
qwen1.5-14b-chat
限时免费
阿里云
qwen1.5-7b-chat
限时免费
阿里云
qwen2-7b
限时免费
阿里云
qwq-32b-preview
限时免费
NOTE
平台限制了每个账号最多可同时运行的微调任务数。若已到达上限,请耐心等待微调任务完成后重试。
清晰的余额、账单与流水信息,让您无忧无虑。
访问费用中心NOTE