管理用户账号、权限、API Key、SSH 公钥等。
预置多种开源/闭源模型,简单易用的 API 便于快速集成
面向开发者的 AI 编程订阅服务,统一接入多家主流编程模型
云端全托管服务,通过 API 调用高效运行生图工作流,优化算力资源与推理效率
托管 Agent 应用与技能的产品,支持 API 接入与控制
Appearance
我们通过持续的技术创新推动普惠 AI,降低算力使用门槛,让高性能算力像基础设施一样服务千行百业。
智算云平台为开发者、企业提供算力服务,包括但不限于以下场景:
智算云平台(又称“控制台”)是智算云平台的主要操作界面和入口。要开始使用智算云平台,您必须首先在智算云平台注册。
智算云平台首页提供租户、用户账号、算力资源池和账户余额等概况信息。租户 ID、租户名、用户 ID 是为您自动生成的,不需要自行设置。
页面中的产品入口会按当前品牌发布范围展示。您还可以从智算云平台首页快速创建 AICoder、访问帮助文档中心等。
智算云平台首页提供 大模型服务平台 入口,可快捷访问 GenStudio 的模型广场、体验中心、模型微调、模型服务等功能模块。
智算云平台首页提供 ComfyUI 工作流平台 入口,可快捷访问 ComfyStack 的工作流管理、模型管理等功能模块。
智算云平台首页提供 智能体服务平台 入口,可体验基于下一代 Agentic Infra 构建的智能体服务平台和 Agent 模板,使用智能体广场、项目管理等功能模块。
智算云平台的租户是一个独立的组织单位,可以管理自己的用户、资源和设置。每个租户都有自己的独立环境,确保数据和操作的隔离性。
在智算云平台中,租户允许您将您组织的所有成员都添加到其中,进行统一管理,共享资源。
智算云平台还将租户作为计费单位。
智算云平台的算力资源分布在不同物理区域,我们使用多区域架构来提供无缝体验。
可以。智算云平台提供私有化部署支持。请联系商务销售团队了解详情。
我们致力于成为大模型时代首选的算力运营商,智算云平台为基于多元芯片算力底座的异构云平台,现在已经储备了丰富的算力资源。
如果需要了解具体可用 GPU 型号或国产算力,请直接联系我们。
如果您使用大模型服务平台(GenStudio),通常仅需要通过 API 使用模型服务,无需关心具体的 GPU 型号。我们会在保证推理精度和性能的前提下,根据您的模型和计算资源需求自动适配 GPU 型号。
智算云平台已经向不同领域的客户提供算力服务,包括但不限于以下场景:
您可以参考GPU 选型指南 (Unavailable in this edition),了解不同 GPU 型号的计算能力和性能。
我们在行业实践中已经积累了丰富的经验,我们会为您推荐合适的算力方案。欢迎您随时联系我们进行咨询。
支持。智算云平台致力于构建多元芯片算力底座的异构云平台,已经适配并支持多款国产厂商的高性能芯片,包括但不限于:
如果您有特定国产芯片型号或算力需求,请联系我们进行咨询。我们会根据您的业务场景和性能要求,为您推荐最合适的国产算力解决方案。
大模型服务平台(GenStudio)是一个模型即服务的平台(MaaS, Model as Service),允许用户与大型语言模型、图像和视频模型进行交互,如聊天、生成图像或视频等。用户还可以通过 API 使用内置或自上传的模型,将这些服务集成到自己的 AI 应用中。我们按使用的 Token 收费。
平台提供以下服务:
大模型服务平台旨在为用户提供强大且灵活的 AI 解决方案,简化模型的使用、微调和部署过程。
您可以使用大模型服务平台(GenStudio)。GenStudio 是一个模型即服务 (MaaS, Model as a Service) 平台,您可以在体验中心与多种主流和先进的模型交互体验,包括大语言模型、图像模型、视频模型。
GenStudio 已支持用户上传自己的模型或 LoRA 适配器,并部署为专属的 API 服务。
除此之外,我们已通过 GenStudio 向众多客户交付了模型 API 服务,在行业实践中已经积累了丰富的经验,我们会为您的业务推荐合适的模型解决方案。欢迎您随时联系我们进行咨询。
大模型服务平台(GenStudio)的模型广场列出了平台预置的多种大模型,包括来源厂商、类型、参数规模、场景任务、上下文长度、最大生成长度等。注意,模型广场首页不展示价格。如需查看单个模型价格,请选择模型卡片,查看输入与输出价格。如租户享受折扣,此处展示折后价。
此外,您还可以前往 GenStudio 服务列表 查看模型列表和单价,包括大语言模型、图像生成模型、视频生成模型。
目前已支持以下计费模式:
没有限制。我们的 API 是 HTTP REST API,因此可以从用任何语言或框架编写的服务中调用。要找到特定语言的后端代码,请使用我们的 API 参考文档:
不支持。目前,大模型服务平台(GenStudio)不支持在体验中心或大语言模型的 API 中发送文件。
无论是体验中心还是 API 服务,我们均不会存储用户与大语言模型的会话历史记录。
创建新租户有多种方式:
智算云平台的租户可以包含的用户数量默认为 1000。如需更大用户数量,请联系销售团队。
如果您确定要删除租户,请联系智算云平台。请注意,此操作不可逆,建议在删除前备份重要数据。
智算云平台采用严格的多租户架构,确保租户间的数据隔离。
超级管理员(或已被授权的其他类似管理员用户)可以邀请其他用户加入租户。 邀请用户加入租户的步骤:
用户账号@租户名称
是的,暂时任何用户都可以更改租户名称。步骤如下:
请注意,更改租户名称会影响所有账户登录,请勿随意更改。
如需使用自有域名,请联系商务销售团队。我们将为您提供多种定制化方案。
管理租户内用户角色和权限的步骤:
智算云平台的部分产品服务开放 API 调用。具体可用 API 会按当前品牌发布范围展示;如果需要以 API 方式使用未公开 API 文档的服务模块,请联系智算云平台提交需求。
GenStudio 大模型服务平台提供多种类型的 LLM API 服务,包括但不限于:
ComfyUI 工作流平台(ComfyStack)支持托管工作流、模型,并以 API 服务的方式供您的应用集成和调用。
大模型服务平台(GenStudio)提供多种类型的 LLM API 服务,包括但不限于:
如果需要图像模型和工作流服务,您可以考虑 ComfyUI 工作流平台。该平台支持以托管工作流方式提供 API 服务。
要开始使用大模型服务平台(GenStudio)的 API 服务,步骤如下:
我们建议先在沙箱环境中测试,然后再转移到生产环境。
您可以直接访问文档中心的 GenStudio API 服务概述,学习相关教程。
API 参考文档通常包括 API 端点描述、请求/响应示例、错误代码说明等。您也可以查看大语言模型 API 参考文档。
如果需要图像模型 ComfyUI API 文档,请查看 ComfyUI API 参考文档。
是的,大模型服务平台(GenStudio)的 API 服务通常有一些使用限制,以确保公平使用和系统稳定:
企业用户可联系我们调整限制。您可以在智算云平台的「用量统计」页面查看您的当前使用情况。
大模型服务平台(GenStudio)采取多重措施保障 API 的安全性:
我们建议客户也实施良好的安全实践,如定期轮换 API 密钥,妥善保管凭证等。
获取智算云平台 API 密钥的步骤如下:
请注意,API 密钥代表您的身份,应当妥善保护,避免泄露。
大模型服务平台(GenStudio)暂未提供第一方 SDK。如果使用 OpenAI 兼容的 Chat Completions API,可使用多种第三方 SDK:
处理大模型服务平台(GenStudio)LLM API 错误和异常的最佳实践:
监控大模型服务平台(GenStudio)API 使用情况和性能的方法:
不提供。API 服务平台暂不提供基于 Webhook 的实时事件通知。
不提供。智算云平台不提供用于 API 测试的沙箱环境。
智算云平台提供多种渠道获取 API 技术支持:
支持。智算云平台针对企业用户提供灵活的 API 服务支持。
如果标准 API 无法满足您的需求,请联系我们讨论可能的定制解决方案。
选择最合适的部署模式取决于您的业务流量模式、性能需求和运维能力。
按量计费 API
包并发服务
建议遵循按量起步、包并发调优、独占实例规模化的路径。
ComfyUI 工作流平台适合以 API 方式快速验证图像生成业务,也支持包并发服务来获得更稳定和可预测的容量。
企业面对多样化的应用场景,每个场景可能需要独特的 workflow 配置和优化,甚至需要频繁调整和部署工作流。这不仅增加了运维复杂度,还在计算资源受限时造成效率低下和成本上升。
为了解决以上痛点,智算云平台推出了 ComfyUI 工作流平台,提供 ComfyUI Workflow 托管服务,希望用户在本地开发工作流的同时,也能享受到云端全托管服务带来的高效体验。
兼容原生 ComfyUI 功能。您仅需要上传从本地 ComfyUI 环境导出的工作流 JSON 文件即可使用(也支持 API Format JSON)。
ComfyUI 工作流平台允许您通过几个 API 调用,无缝地使用原生 ComfyUI 功能,大大节省时间和精力,使用户能够更专注于核心业务而非工具的使用。得益于与原生 ComfyUI 的兼容性,还可以及时享受 ComfyUI 的更新和改进,确保工作流程始终保持最新。
迁移步骤如下:
如需总体了解云端全托管 ComfyUI 工作流的解决方案,请参考 ComfyUI 工作流平台文档。
是的,托管服务支持自定义节点:
通常情况下,托管服务会提供更好的性能:
ComfyUI 工作流平台采用严格的安全措施保护用户数据:
使用 ComfyUI 工作流平台托管工作流可带来明显的成本优势:
ComfyUI 工作流平台提供灵活的定价模式:
上传自定义模型资产的步骤如下:
scp
sftp
FileZilla
ComfyUI 工作流平台还支持直接从 HuggingFace、ModelScope、LibLib、CivitAI 等来源下载模型。操作说明请参考 ComfyUI 工作流平台文档。
ComfyUI 工作流平台目前支持以下 ComfyUI 模型系列:
您可以通过以下方式学习和使用 ComfyUI 托管工作流服务的 API:
提交生图任务的 API 入参结构和具体参数与 ComfyUI Workflow 使用的节点有关,建议先参考 [ComfyUI 托管工作流 API 使用教程](../../comfy-stack/tutorial-comfyui.md) 学习 API 调用流程。
ComfyUI 工作流平台对所有用户提供 ComfyUI 工作流托管服务。
由于合规要求,ComfyUI 工作流平台部分功能(例如创建私有环境)目前仅对企业级用户开放。
托管服务对于频繁修改非常友好:
ComfyUI 工作流平台特别适合以下场景:
智算云平台是一个综合性 AI 开发与服务平台。不同品牌会按发布范围展示可用服务模块;如果您需要确认某个服务是否可用,请联系商务或售后团队。
大模型服务平台(GenStudio)是一个专注于大语言模型(LLM)的平台,提供模型体验、个性化微调和 API 服务化功能。
ComfyUI 工作流平台(ComfyStack)是一个基于 ComfyUI 构建的图像生成平台,提供托管式的工作流 API 调用服务。
智能体服务平台基于下一代 Agentic Infra 范式构建,帮助企业和开发者跨越技术门槛,构建具备自主决策能力的顶尖应用。
支持。大模型服务平台(GenStudio)提供丰富的大语言模型 API、视觉模型 API、视频模型 API,并全面支持按实际使用的 Token 用量计费。
如果您的主要场景为编程,还可以考虑 Infini 编码套餐(仅 infini-ai 品牌提供)。它是预付费套餐模式的新选择,可为您提供更具性价比的 API 调用方案。
不同的模型有不同的 Token 计算标准。我们建议您访问大模型服务平台的服务列表页面,查看我们支持的每种模型的详细 Token 输入/输出费用价格表。
不一样。和行业标准一致,我们按模型收费。不同能力、不同上下文长度的模型,其输入(Prompt Token)和输出(Completion Token)的单价都是不同的。
详细价格请参考:
有的。对于大模型 API 调用量大且稳定的客户,除了按 Token 用量计费,大模型服务平台(GenStudio)还提供按月购买并发数量的购买模式。
这种方式更适合高频次、可预测的业务场景,能帮企业用户更好地控制成本。关于包并发服务的详细介绍,请参考LLM API 计费规则。
如果您的主要场景为编程,可以考虑 Infini 编码套餐(仅 infini-ai 品牌提供),为您提供更具性价比的 API 调用方案。
如果您需要调用现成的大模型 API(LLM API),请选择大模型服务平台(GenStudio)。该服务支持按 Token 计费,也可在适用场景下选择包并发服务。
如果您的主要场景为编程,可以考虑 Infini 编码套餐(仅 infini-ai 品牌提供)预付费套餐。
因为我们的平台服务于不同类型的 AI 开发者,所以提供了灵活的计费选项。您可以只选择需要的服务;不同品牌会按发布范围展示可用计费方式。
大模型服务平台(GenStudio)支持按 Token 用量计费,适合调用大模型 API(LLM API)的开发者。
如果需要更具性价比的 API 方案,也可考虑采用预付费模式的 Infini 编码套餐(仅 infini-ai 品牌提供)。
ComfyUI 工作流平台(ComfyStack)支持按工作流实际运行时长计费,适合调用 ComfyUI 工作流 API 的开发者。
您应该选择大模型服务平台(GenStudio),并使用按 Token 用量计费模式。这是最直接、最符合行业标准的 LLM API 调用方式。LLM、VLM 均支持按 Token 计费。
如果您对 LLM API 有高频次、稳定的并发调用需求,也可以考虑按月购买并发数量(QPS)的套餐。关于包并发服务的详细介绍,请参考LLM API 计费规则。
如果您的主要场景为编程,可以考虑 Infini 编码套餐(仅 infini-ai 品牌提供)预付费套餐,它为您提供更具性价比的选择。
登录您的智算云平台账户后,您可以在费用中心 > 账单 > 明细账单中,按产品(选择 预置服务按量在线调用)等条件筛选,实时查看您每一笔 API 调用的 Token 消耗和费用。
自 2026 年 3 月 30 日起,GenStudio 已停止提供基础版 LLM API 免费服务;通过 API 调用预置大语言模型按实际 Token 用量计费,请关注账户余额并及时充值。GenStudio 体验中心(网页端)仍暂不计费。向量嵌入与重排序模型 API 仍暂不收费。
若需更具性价比的编码场景用量,可考虑 Infini 编码套餐。
智算云平台采用灵活的定价模式,具体定价取决于您的需求和使用情况。不同品牌会按发布范围展示可用服务和计费方式。我们建议您联系销售团队,获取最适合您的定价方案。
ComfyUI 工作流平台支持按 API 请求的工作流实际运行时长计费,仅对实际运行时长收费。当前已提供标准版、加速版、大显存版、大显存加速版。
大模型服务平台(GenStudio)提供大语言模型 API、视觉语言模型 API、视频生成模型 API 等,支持按 Token 用量计费,也支持按月购买并发数量计费。
Infini 编码套餐(仅 infini-ai 品牌提供)提供按月订阅大模型 API 的方案,可作为更具性价比的选择。
为了给您提供更细致的回复,建议您细化问题,说明您需要了解哪方面的免费资源或服务。
如需试用收费服务,可联系销售团队获取免费试用资格。
大模型服务平台(GenStudio)的大语言模型 API 通过 API 调用时按 Token 用量计费。体验中心(网页端)暂不计费。自 2026 年 3 月 30 日起已停止基础版 LLM API 免费服务,请关注账户余额。
大模型服务平台(GenStudio)免费提供向量嵌入模型 API(Embeddings)和重排序模型 API(Reranker)。
按量计费的服务一般整点出明细账单并扣费(稍有延迟)。您可以前往智算云平台的费用中心,点击进入左侧导航栏流水页面,筛选查看详细的扣费记录。
请确保您的支付方式在扣费时有足够的余额,以避免服务中断。如果您对账单有任何疑问,可以随时联系智算云平台的客户支持团队获取帮助。
大模型服务平台(GenStudio)按 Token 用量计费的 API 服务一般整点出明细账单并扣费(稍有延迟)。您可以在费用中心的流水页面筛选查看详细扣费记录。
ComfyUI 工作流平台按运行时长计费的托管工作流服务一般整点出明细账单并扣费(稍有延迟)。您可以在费用中心的流水页面筛选查看详细扣费记录。
从 2026 年 3 月 2 日开始,支持在费用中心·发票开具页面线上自助开具发票。如果有特殊发票要求,请联系我们。
智算云平台理解非营利组织和教育机构的特殊需求,通常会为这些机构提供优惠:
选择合适的定价方案需要考虑您的团队规模、预期使用量、所需功能和预算限制。
我们建议您先联系销售团队,获取试用资格,他们可以根据您的具体需求推荐最合适的方案。
如果您主要调用 LLM API,推荐您了解 Infini 编码套餐(仅 infini-ai 品牌提供),它提供了更具性价比的 API 调用方案。
如果您购买了一站式 AI 平台(AIStudio) 的包年包月套餐,由于可能的合同限制,您无法主动更改定价方案。如有特殊需求,请联系智算云平台。
您可以通过费用中心了解账户使用情况和费用。
对于企业用户,具体取消政策可能因您的合同而异,建议查看服务条款或联系客户支持。
是的,智算云平台为大型企业和特殊需求客户提供定制化方案:
智算云平台的代金券是一种数字凭证,可以用于获得折扣或兑换我们平台上的商品和服务。它可以帮助您节省使用智算云平台服务的费用。
您可以通过多种方式获得智算云平台的代金券:
智算云平台代金券的有效期因不同类型而异。一般来说,代金券的有效期可能从 30 天到 1 年不等。您可以在代金券详情中查看具体的有效期限。请注意在有效期内使用您的代金券。
使用智算云平台代金券很简单。智算云平台在对帐单进行扣费时,系统会自动将代金券抵扣到您的订单中,无需手动操作。代金券自动抵扣的规则如下:
智算云平台的代金券是与您的租户绑定的,租户下的所有用户发生的消费均可使用租户代金券抵扣。
由于代金券不绑定具体用户,因此无法在用户之间转让。
如果您有特殊情况需要转让代金券,请联系我们的客户支持团队。
这取决于具体的促销规则。一些代金券可以与其他优惠叠加使用,而另一些可能不允许。在使用代金券时,系统会明确告知您是否可以与其他优惠同时使用。如有疑问,您可以查看代金券的使用条款或联系客户支持。
如果您的订单金额小于代金券金额,代金券剩余额度可继续使用。系统在每次结帐时均会优先扣减代金券内剩余额度。
智算云平台将作废代金券剩余额度。现金额度退款方式与具体活动有关,请联系我们的客户支持团队,我们会根据具体情况进行处理。
一旦代金券被使用并应用到订单中,通常是不能取消的。如果您在使用代金券后立即发现问题,请尽快联系客户支持,我们会尽力协助您解决问题。
如果帐单生成后才获取使用代金券,通常是无法在历史帐单中使用代金券的。我们会在您的下一个帐单中优先扣减代金券。
部分代金券可能设有最低使用金额限制。这些限制会在代金券的使用条款中明确说明。在使用代金券之前,请仔细阅读相关条款,确保您的订单满足使用条件。
您可以通过费用中心的代金券查看代金券余额和使用记录。
大多数代金券可以用于智算云平台的主要服务。然而,某些特定的代金券可能只适用于特定的服务或产品。使用前请仔细阅读代金券的使用说明和限制条件,以确保它适用于您想购买的服务。
可以。系统将在帐单扣费时自动使用代金券抵扣。如果存在多个代金券,优先使用代金券,代金券总剩余额度不足时才会扣减账户内现金余额。
如果您发现您的代金券被盗用,请立即采取以下步骤:
无法克隆 GitHub 上的项目,或无法从 HuggingFace,主要原因是由于中国大陆地区网络访问 GitHub/HuggingFace 等部分境外服务存在延迟或阻断问题,导致失败或超时。
https://cloud.infini-ai.com/maas/v1
如需查看 GenStudio LLM API 限额,可在控制台的「服务列表」页面可查看当前服务等级、API 限频与各模型单价,并可自助升级至更高服务等级(享受更高限频)。企业用户可联系支持定制配额与价格。
智算云平台提供多种 API 服务,具体接口会按当前品牌发布范围展示。如果对其他服务 API 有需求,请联系商务销售团队。
GenStudio 提供预置 LLM 默认 Chat Completions API 接口,以及预置 LLM M×N Chat Completions API 接口(支持多模型芯片组合)。
ComfyUI 工作流平台提供工作流托管 API,可用于托管工作流调用和应用集成。
API 端点即 API Endpoint,是 API 的具体访问路径,通常基于 API Base URL 构建,用于执行特定操作。
API Base URL 是 API 的基础 URL,表示 API 服务器的根地址。智算云平台提供多种 API 服务,因此有多个 API 端点(Endpoints)。在获取 API 端点、API Base URL 和使用方法时,请务必参考具体产品的 API 文档。
在智算云平台中,GenStudio 提供 OpenAI 兼容的 Chat Completions 端点 /chat/completions。GenStudio Chat Completions 默认接口的完整地址为 https://cloud.infini-ai.com/maas/v1/chat/completions。
/chat/completions
https://cloud.infini-ai.com/maas/v1/chat/completions
GenStudio OpenAI 兼容 API Base URL 为 https://cloud.infini-ai.com/maas/v1。
ComfyUI 工作流平台 API 有独立的 API 文档和端点说明。请参考 ComfyUI 工作流平台的 API 参考文档确认具体 API Base URL、Endpoint 和参数。
我们已在模型广场页面为每个模型卡片提供了关键指标,包括上下文长度、最大输出长度、参数规模等。
RPM/TPM/RPD 取决于您的 LLM API 服务等级(基础服务/高级服务/企业服务)。您可以在控制台的GenStudio 服务列表页面查看当前服务等级及其对应的限额。如需更高限额,可自助升级至更高服务等级,或联系商务定制配额。
我们不提供如成功率等统计类指标,这类数据需要基于租户自身统计数据。
目前我们也不提供 LLM API 测试工具或测试指导。如需了解 LLM API 性能相关指标,请联系商务。
GenStudio 不再提供独立的价格页。请使用以下两个入口:
对于大语言模型服务,支持按 Token 用量计费;在适用模型上也支持包并发模式。