预置模型指由模型厂商发布、平台预先集成并由平台托管与维护的模型,您可以直接调用 API,无需自行部署模型。预置模型会不定期更新,模型列表以模型广场展示为准。
预置推理 API 服务按模型的参数量级,采用分层定价。计价单位:元/千 Token。基础版费用全免,仅高级版/企业版按量计费。后付费模式,每小时出账。大语言模型的输入和输出分别定价。
注意
当前针对 API Key 设置了 RPM(每分钟请求数)、RPM(每天请求数)、TPM(每分钟 Token 数量)限制。具体限制可参考 API 限频。如需提升,可联系售后。
包并发计费模式适合要求业务稳定性、或对预算管理有强诉求的客户。客户按并发数采购,在购买的并发数量内的 API 请求高优处理,享受类似专属实例的体验,但更实惠的价格。
包并发模式下,客户按并发数采购,成本可控。仅部分预置推理 API 服务支持包并发计费模式。采购单位:元/每并发请求数。如需采购,可请联系商务。
注意
阿里云
qwen1.5-14b-chat
3.5
阿里云
qwen2.5-14b-instruct
3.5
阿里云
qwen2.5-32b-instruct
4.9
阿里云
qwen2.5-7b-instruct
1.6
阿里云
qwen2-7b-instruct
1.6
阿里云
qwen1.5-7b-chat
限时免费
阿里云
qwen2-7b
限时免费
Meta
llama-2-7b-chat
限时免费
注意
平台限制了每个账号最多可同时运行的微调任务数。若已到达上限,请耐心等待微调任务完成后重试。
清晰的余额、账单与流水信息,让您无忧无虑。
访问费用中心注意
当账户被扣为负值时,说明账户已欠费。请及时充值偿付欠款,以免影响您的正常使用。