直接调用 GenStudio 预部署的大模型 API 服务,无需自行部署模型。采用后付费模式,每小时出账。按量计费,价格单位为每千个 Token,包括大语言模型的输入和输出 Token。
预置推理 API 服务按模型的参数量级,采用分层定价。计价单位:元/千 Token。
31-60B
deepseek-r1-distill-qwen-32b
0.002 / 0.002
100B+
deepseek-r1deepseek-v3pro-deepseek-v3
0.004 / 0.0160.002 / 0.0080.002 / 0.008
1-10B
qwen2-7b-instructqwen2.5-7b-instruct
0.001 / 0.0010.001 / 0.001
11-30B
qwen1.5-14b-chatqwen2.5-14b-instruct
0.002 / 0.0020.002 / 0.002
31-60B
qwen1.5-32b-chatqwen2.5-32b-instructqwen2.5-coder-32b-instructqwen2.5-vl-32b-instructqwq-32b-previewqwq-32b
0.0029 / 0.00290.0029 / 0.00290.0029 / 0.00290.0058 / 0.0580.0029 / 0.00290.0029 / 0.0029
61-100B
qwen1.5-72b-chatqwen2-72b-instructqwen2.5-72b-instruct
0.005 / 0.0050.005 / 0.0050.005 / 0.005
1-10B
llama-3-8b-instructllama-3-infini-8b-instruct
0.001 / 0.0010.001 / 0.001
61-100B
llama-3.1-70b-instructllama-3.3-70b-instruct
0.005 / 0.0050.005 / 0.005
1-10B
chatglm3-6b-baseglm-4-9b-chat
0.001 / 0.0010.001 / 0.001
31-60B
chatglm3
0.0029 / 0.0029
1-10B
megrez-3b-instruct
限时免费
11-30B
gemma-2-27b-it
0.0029 / 0.0029
31-60B
yi-1.5-34b-chat
0.0029 / 0.0029
1-10B
bge-m3jina-embeddings-v2-base-codejina-embeddings-v2-base-zh
限时免费限时免费限时免费
1-10B
bge-reranker-v2-m3
限时免费
NOTE
当前针对 API Key 设置了 RPM(每分钟请求数)、RPM(每天请求数)、TPM(每分钟 Token 数量)限制。具体限制可参考 API 限频。如需提升,可联系售后。
直接上传 LoRA 文件,并指定基础模型,即可为不同业务场景的部署专属推理服务。按模型的参数量级,采用分层定价。计价单位:元/千 Token。
阿里云
qwen1.5-14b-chat
0.0035 / 0.0035
阿里云
qwen2-7b-instruct
0.0016 / 0.0016
阿里云
qwen2.5-14b-instruct
0.0035 / 0.0035
阿里云
qwen2.5-32b-instruct
0.0049 / 0.0049
阿里云
qwen2.5-7b-instruct
0.0016 / 0.0016
微调费用取决于模型大小、数据集大小和 epoch 数。GenStudio 按微调服务使用 Token 数量计费(训练数据 ✕ 迭代轮次)。微调任务完成后出账。
阿里云
qwen1.5-14b-chat
限时免费
阿里云
qwen1.5-7b-chat
限时免费
阿里云
qwen2-7b
限时免费
Meta
llama-2-7b-chat
限时免费
NOTE
平台限制了每个账号最多可同时运行的微调任务数。若已到达上限,请耐心等待微调任务完成后重试。
清晰的余额、账单与流水信息,让您无忧无虑。
访问费用中心NOTE