ComfyUI 工作流平台计费规则

为满足多样化的工作流推理与图像生成需求，ComfyUI 工作流平台提供按时长计费与包并发两种模式，并区分不同性能规格。您可根据业务负载与稳定性要求，自由组合，获得最优性价比。

提示

大客户或长期合作用户可联系商务或售后服务，我们将根据您的实际用量和合作情况提供包并发等其他个性化方案。

按量计费

按量计费以工作流的实际运行时长（秒）为依据，采用后付费、按自然小时出明细结算；模型加载时间计入，排队等待与数据存储不计入；优先使用代金券抵扣，超出部分从余额扣除。

按量计费刊例价

以下为 ComfyUI 工作流平台按量计费的刊例单价。

版本规格	售卖方式	刊例价	说明
标准版	按每个工作流的渲染/生成耗时长计费	¥0.0028 每秒	✅ 性价比高
加速版	按每个工作流的渲染/生成耗时长计费	¥0.0050 每秒	✅ 性能更优
大显存版	按每个工作流的渲染/生成耗时长计费	¥0.0042 每秒	🆕 适合显存需求较高任务
大显存加速版	按每个工作流的渲染/生成耗时长计费	¥0.0076 每秒	🆕 高性能 + 大显存

信息

含「加速版」版本规格需通过平台销售人员协助开通。加速版实际加速效果与模型、工作流设计等因素有关。请联系商务或售后服务咨询如何获取更优的加速效果。
版本规格对应平台提供的预置运行环境（标准版/大显存版/加速版/大显存加速版）。如需使用自定义运行环境（私有环境），不在本页价格覆盖范围，详见关联运行环境。

按量计费规则

本节说明 ComfyUI 工作流平台按量计费定义与结算规则，包括计费口径、账期与抵扣、以及哪些时间计入/不计入费用。

从工作流请求开始执行推理时起，到平台生成结果为止，定义为工作流实际运行时长（即计费时长）。
- 如发生排队等待（指任务状态处于「排队中」），排队时长不计入实际运行时长。
- 如工作流首次执行或模型不在缓存中时，会发生模型加载时时长，该部分时长计入计费时长。
- 示例: 假设工作流从请求到生成结果，总共耗时 30 秒，其中排队 10 秒，则计费时长为 20 秒。
失败/取消场景：
- 任务失败：按实际运行至失败时的时长计费。
- 用户取消：按取消发生时已消耗的运行时长计费。
采用后付费模式，每自然小时生成明细账单，结算并扣费。
优先采用代金券抵扣，超出部分从余额扣除。

信息

模型加载时长是指平台加载模型到计算资源所耗费的时间。为了优化成本，平台会尽可能缓存常用模型。在短时间内重复使用相同模型的工作流，模型加载时间通常只会统计一次。在缓存有效期内重复使用相同模型，通常不会重复计入加载时长；缓存有效期随资源调度而变化，不作硬性保证。

警告

长时间运行的工作流

平台理论上对工作流的最长运行时间没有硬性限制。但强烈建议您优化工作流设计，避免不必要的长时间运行。长时间运行的工作流可能会增加任务失败的风险，并产生较高的费用。如有特殊长时间运行需求，请提前与我们沟通，以便我们评估资源情况并提供支持。

按量计费精度

金额计算单位为元，实际数字精度为小数点后 6 位。例如，¥0.000765。
运行时长计算单位为秒，实际数字精度为小数点后 3 位。例如，3029.284 秒。
每自然小时统计累计运行时长，结算费用；不单独计算单次调用的费用。
超出计费精度处理：按账期扣费时，累计金额将向下取整至小数点后 6 位。

包并发服务

ComfyUI 工作流平台包并发服务是一种全新的计费与容量保障方式，通过购买并发数（Concurrency Slots），您可以在 ComfyUI 工作流平台推理服务中享受独占的并发能力，与传统的按工作流运行时长（秒数）计费方式相比，具有更好的可预测性与可控性。

信息

包并发服务需通过平台销售人员协助开通。

包并发服务刊例价

以下为 ComfyUI 工作流平台包并发服务的刊例价格。

版本规格	售卖方式	刊例价
标准版	单并发包月	¥1,600 每单个并发
加速版	单并发包月	¥2,560 每单个并发
大显存版	单并发包月	¥2,240 每单个并发
大显存加速版	单并发包月	¥3,580 每单个并发

信息

版本规格对应平台提供的预置运行环境（标准版/大显存版/加速版/大显存加速）。如需使用自定义运行环境（私有环境），不在本页价格覆盖范围，详见关联运行环境。
加速版实际加速效果与模型、工作流设计等因素有关。请联系商务或售后服务咨询如何获取更优的加速效果。
购买并发数量大时，可联系商务协商折扣。

优势

性价比高：与云厂商的独占实例相比，购买并发数成本更低，但能提供类似的 SLA 保障。
费用可预测性：包并发服务提供灵活的消费方式。
- 可按工作流选择溢出策略：无限排队（零溢出成本）、不排队（立即按量，低延迟）、限时排队（在排队时长内等待空闲的并发槽位）。
- 选择无限排队可实现仅按已购并发数收取月费、锁定预算；选择不排队（立即按量）可避免等待、保障低延迟。
灵活可控：您可以根据业务规模灵活调整购买的并发数量。

服务说明

并发数定义：每个并发数代表 1 个正在执行的 ComfyUI 工作流 API 请求。当您购买了 10 个并发数，即可保证在任意时刻最多 10 个请求同时运行。

信息

并发数需要按版本规格购买。例如，购买大显存版 10 个并发数，所购并发数仅适用于请求已关联大显存版运行环境的工作流。

请求超出已购并发数时的处理

当您的请求数量超过已购买的并发数时，可按工作流选择以下策略：

无限排队：仅在已购并发资源内处理任务。超出部分进入队列等待，直到出现空闲并发槽位后依序执行；不会触发按量计费。
不排队（立即按量）：当已购并发资源全部忙碌时，新任务将立刻以按量计费方式执行，避免排队等待。
限时排队：可为具体工作流配置「排队时长」。在已购并发数全部被占用时，由该工作流的创建的任务可排队，但限制其最长排队时长；等待期间一旦出现空闲槽位即刻执行。如果等待超过最大排队时长，则转为按量计费请求。
信息
排队时长为工作流级别配置，适用于通过该工作流发起的所有请求。配置入口见工作流详情页的「任务设置」标签页，详见在线调试工作流—任务设置。
并发数释放：当一个占用并发数的请求完成推理并返回结果后，该请求所占并发槽位立即释放，可供新的请求使用。

使用限制与配额

ComfyUI 工作流平台包并发服务同样受 API 频率限制指标约束：
- RPM（每分钟请求数），详见 ComfyUI 工作流平台 API 限频
我们会与购买包并发服务的用户协作，合理配置上述限频参数，确保在您的业务场景下获得最顺畅的 API 使用体验。

典型使用场景

预算敏感型用户：希望严格控制每月支出，可选择包并发模式并拒绝多余请求，避免溢出费用。
低延迟业务：对实时性要求较高，可选择包并发模式，超出请求转按量付费，保证请求响应速度。
混合型需求：既有实时延迟敏感业务，也有低敏感非关键任务，可使用灵活的购买策略。例如：
- 为实时延迟敏感业务接入支持包并发服务的版本规格。
- 低敏感非关键任务仍接入仅按量付费的版本规格。

计费适用范围

以下入口会产生计费，按所选计费模式（按量/包并发）结算：

通过 ComfyUI 工作流 API 调用工作流
在页面上试运行工作流的运行时长（使用试运行按钮，或使用原生 ComfyUI 编辑器）
具体单价以工作流绑定的运行环境（版本规格）为准

不计费范围

以下场景不产生费用：

数据存储：输入图片存储，出图结果存储、私有模型存储等暂不纳入计费范围。

处理余额不足

余额不足会阻止 API 执行、试运行和创建工作流。请先确认租户账户余额充足；如果需要核对余额、账单或流水，请查看费用管理。

费用查看

智算云平台费用中心提供了租户的流水，以及所有服务的订单、月账单、明细等信息。

查看实时费用

ComfyUI 工作流平台会在每个自然小时结束后生成账单明细。

采用 API 方式调用工作流后，无法查看当次调用费用，可查询当次调用记录与运行时长。具体操作参考工作流调用记录。
如果需要评估工作流的单次调用的费用，可使用工作流详情页的「试运行」功能。具体操作参考在线调试工作流。

试运行工作流时，可以在页面上调整工作流的参数，在任务结束后会显示当次调用的预估金额。每次调用实际费用可能会因模型加载时间、网络波动等因素略有波动。

提示

如需对照实际运行时长（计费时长）与 ComfyUI 日志输出的运行时长，可在调用记录的「执行日志」中查找以 Prompt executed … 开头的行作为近似参考，并结合「节点详情」分析节点耗时；最终计费以平台统计的运行时长为准。详见计费时长与日志对照。

查看明细账单

访问费用中心账单页面，切换到「明细账单」，产品名为「ComfyUI工作流调用」。

费用中心

每个自然小时结束后生成账单明细，加入当前自然月的月账单中。例如，0 点-1 点的费用明细会在1点后生成，更新至当月账单中。
明细账单计算方式：每自然小时累计总运行时长 × 单价
所有时间均为北京时间 (UTC+8)。

信息

明细账单提供每自然小时累计费用，不单独计算单次调用的费用。
跨整点执行的任务计入下一个计费周期。例如，如果一个任务在 23:59:30 开始执行，并在 00:00:30 结束，则该任务的计费周期将计入 0 点-1 点的小时账单中。简单来说，以任务结束时间所在的小时为准。

查看月度账单

访问费用中心账单页面，切换到「月账单」，可查看当月累计总消费额、总余额消费情况、可开票金额。注意月账单包含当前租户所有产品服务发生的费用。

费用中心

欠费处理

平台支持可用余额预警。可用余额低于已设置阈值时，平台会向超级管理员绑定的手机号发送短信通知。为避免欠费影响线上业务，请在费用中心账户页面配置预警，并及时处理余额不足。

停用功能

欠费时无法使用以下功能：

通过 API 执行工作流
试运行功能
创建新工作流

欠费错误提示

欠费时 API 与网页端均有相关提示：

API 返回 HTTP 402 错误。
在页面上进行操作 (例如，试运行工作流、上传工作流、修改配置等) 时，平台会提示错误信息。

恢复服务

补足账户余额或按服务支持提供的方式处理欠费。
余额为正时自动恢复，无需人工处理（可能需要等待 5 分钟左右）

常见问题

ComfyUI 工作流托管服务是按什么计费的？

版本规格：ComfyUI 工作流托管平台提供不同规格版本，包括标准版、加速版、大显存版、大显存加速版。
计费模式：
- 支持按量计费（按 ComfyUI 工作流实际运行时长，不含排队时间）；具体单价费用，详见按量计费刊例价。
- 支持包并发服务（按单个并发数包月计费）。具体单价费用，详见包并发服务刊例价

在平台上搭建、编辑工作流暂不收取费用。

如何查看每次调用计费时长?

在调用记录中可以查看每次执行的具体开始时间、运行时长。运行时长即为实际发生计费的执行时间。执行记录会详细记录每次工作流执行的执行日志、各节点运行的耗时等，方便您进行性能分析和成本优化。执行记录中的时间均为北京时间 (UTC+8)。

ComfyUI 调用记录

信息

调用记录页面可查看计费的运行时长，不展示当次调用具体费用。

试运行会收费吗？

会，试运行与正式执行采用相同的计费标准。

试运行旨在帮助您快速验证工作流效果和预估调用金额，因此试运行也会产生费用。试运行金额仅反应当次调用金额，实际调用时，每次调用可能因模型加载时间、网络波动等因素略有波动，请以账单明细为准。

任务失败是否收费？

是的，系统会按实际运行时长收费，即使任务最终失败。

如果因 平台自身故障 导致任务失败（例如，平台服务器宕机、网络异常等），您可以联系客服申请补偿。因用户自身工作流配置错误或节点异常导致的任务失败，由于平台会消耗计算资源进行模型加载和工作流执行，即使最终结果不可用，也会按实际运行时长计费。对于因工作流配置错误或节点异常导致的任务失败，平台无法提前预判。建议您在正式使用前，充分测试和验证您的工作流配置，确保其稳定性和正确性。

如何预估费用？

试运行时会显示当次调用金额，您可以据此评估正式使用成本。

粗略估算费用：预估费用 = 平均工作流运行时长 x 单价 (0.004元/秒)

您可以通过优化工作流节点、精简模型等方式来降低执行时间，从而降低费用。影响实际费用的因素包括但不限于：模型复杂度、节点计算量、生成图片/视频的分辨率、网络环境波动、以及偶发的系统资源竞争等。在高负载时段，实际执行时间可能会略有波动，导致最终费用略有差异，敬请谅解。更准确的费用请以实际账单为准。

模型加载时间每次都会计费吗？如何减少模型加载费用？

模型加载时间并非每次都会发生。平台会尽可能缓存常用模型。您可以考虑以下影响因素：

首次使用某个工作流时，需要加载模型，此时会产生模型加载费用。
如果您在短时间内多次执行使用相同模型的工作流，平台通常会直接从缓存中加载模型。模型缓存有效取决于平台资源调度策略，但通常会尽可能延长缓存时间。模型缓存机制旨在为您节省重复模型加载的费用。
长时间未使用后再次执行：如果距离上次使用时间较长，模型可能已从缓存中释放，再次执行时可能需要重新加载模型。

余额不足暂停服务后，数据会丢失吗？我需要重新上传工作流吗？

余额不足暂停服务不会导致您的数据丢失。

您的工作流文件、配置信息、历史执行记录等数据都将完整保留。当您补足账户余额后，服务会自动恢复，您无需重新上传工作流或进行任何人工操作。

余额不足时，排队中的工作流会怎样？

租户欠费后，对于已进入队列但尚未执行的工作流，系统将 不会继续执行，并返回欠费错误提示。

是否支持设置消费限额或预算告警？

支持。您可以通过预算管理为用户设置自然月或自然周内的消费上限。预算按单用户独立生效，达到上限后，预算覆盖产品的继续消费会受限。预算是否覆盖 ComfyStack 相关产品，请以预算管理页面可选择的适用产品为准。

平台也支持可用余额预警。可用余额低于已设置阈值时，平台会向超级管理员绑定的手机号发送短信通知。配置说明请参见账户与余额。

是否有更优惠的套餐或包月服务？

您可以考虑包并发服务。如果有大规模、高频使用的需求，欢迎联系商务或售后服务。

是否有针对大客户或高频用户的更灵活计费方案？

如果您属于大客户或高频用户，并对更灵活的计费方案感兴趣，请联系销售团队洽谈合作，我们将竭诚为您服务，提供更具竞争力的价格和更优质的服务支持。欢迎联系商务或售后服务。

如果我对计费账单有疑问或争议，如何处理？

如果您对计费账单有任何疑问或争议，请第一时间联系商务或售后服务。我们将认真核对您的账单明细和执行记录，并尽快为您解答疑问或处理争议。

请求超出已购并发数时，应该选择哪种溢出处理策略？

无限排队：只用已购并发，零溢出成本，延迟不可控。
不排队（立即按量）：零排队、低延迟，超出部分按量计费。
限时排队：在排队时长内等待空闲槽位；等待期出现空闲即执行，兼顾成本与体验。

参见请求超出已购并发数时的处理。

版本规格和运行环境是什么关系？为什么和价格相关？

版本规格对应平台提供的预置运行环境（标准版/大显存版/加速版/大显存加速）。
具体单价以工作流绑定的运行环境（版本规格）为准。

我可以用私有环境吗？如何计费？

可以。私有环境（自定义运行环境）费用不在本页在线刊例价格覆盖范围，价格请联系商务或售后。

购买多个并发有折扣吗？

有。超过并发数量大时可获得更优惠单价，详见包并发服务或联系商务。

「大显存版」运行环境是什么配置，多有大显存？

ComfyUI「大显存版」运行环境可满足需要更多 VRAM 的场景，例如：

ComfyUI 生图业务要求要用大参数的模型，或者不能使用量化后的模型。例如，工作流使用 Flux FP16，再配合一些ControlNet、IPAdapter 之类的模型。
部分视频模型对显存要求高。
支持超高输入输出的分辨率，例如高清放大到 2Wx2W。

按量计费 ​

按量计费刊例价 ​

按量计费规则 ​

按量计费精度 ​

包并发服务 ​

包并发服务刊例价 ​

优势 ​

服务说明 ​

请求超出已购并发数时的处理 ​

使用限制与配额 ​

典型使用场景 ​

计费适用范围 ​

不计费范围 ​

处理余额不足 ​

费用查看 ​

查看实时费用 ​

查看明细账单 ​

查看月度账单 ​

欠费处理 ​

停用功能 ​

欠费错误提示 ​

恢复服务 ​

常见问题 ​

ComfyUI 工作流托管服务是按什么计费的？ ​

如何查看每次调用计费时长? ​

试运行会收费吗？ ​

任务失败是否收费？ ​

如何预估费用？ ​

模型加载时间每次都会计费吗？ 如何减少模型加载费用？ ​

余额不足暂停服务后，数据会丢失吗？我需要重新上传工作流吗？ ​

余额不足时，排队中的工作流会怎样？ ​

是否支持设置消费限额或预算告警？ ​

是否有更优惠的套餐或包月服务？ ​

是否有针对大客户或高频用户的更灵活计费方案？ ​

如果我对计费账单有疑问或争议，如何处理？ ​

请求超出已购并发数时，应该选择哪种溢出处理策略？ ​

版本规格和运行环境是什么关系？为什么和价格相关？ ​

我可以用私有环境吗？如何计费？ ​

购买多个并发有折扣吗？ ​

「大显存版」运行环境是什么配置，多有大显存？ ​