ComfyUI 工作流平台计费规则
为满足多样化的工作流推理与图像生成需求,ComfyUI 工作流平台提供按时长计费与包并发两种模式,并区分不同性能规格。您可根据业务负载与稳定性要求,自由组合,获得最优性价比。
提示
大客户或长期合作用户可联系商务或售后服务,我们将根据您的实际用量和合作情况提供包并发等其他个性化方案。
按量计费
按量计费以工作流的实际运行时长(秒)为依据,采用后付费、按自然小时出明细结算;模型加载时间计入,排队等待与数据存储不计入;优先使用代金券抵扣,超出部分从余额扣除。
刊例价
以下为 ComfyUI 工作流平台按量计费的刊例单价。
| 版本规格 | 售卖方式 | 刊例价 |
|---|---|---|
| 标准版 | 按每个工作流的渲染/生成耗时长计费 | ¥0.004 每秒 |
| 大显存版 | 按每个工作流的渲染/生成耗时长计费 | ¥0.006 每秒 |
按量计费规则
本节说明 ComfyUI 工作流平台按量计费定义与结算规则,包括计费口径、账期与抵扣、以及哪些时间计入/不计入费用。
- 从工作流请求开始执行推理时起,到平台生成结果为止,定义为工作流实际运行时长(即计费时长)。
- 如发生排队等待(指任务状态处于「排队中」),排队时长不计入实际运行时长。
- 如工作流首次执行或模型不在缓存中时,会发生模型加载时时长,该部分时长计入计费时长。
- 示例: 假设工作流从请求到生成结果,总共耗时 30 秒,其中排队 10 秒,则计费时长为 20 秒。
- 失败/取消场景:
- 任务失败:按实际运行至失败时的时长计费。
- 用户取消:按取消发生时已消耗的运行时长计费。
- 采用后付费模式,每自然小时生成明细账单,结算并扣费。
- 优先采用代金券抵扣,超出部分从余额扣除。
注意
模型加载时长是指平台加载模型到计算资源所耗费的时间。为了优化成本,平台会尽可能缓存常用模型。在短时间内重复使用相同模型的工作流,模型加载时间通常只会统计一次。在缓存有效期内重复使用相同模型,通常不会重复计入加载时长;缓存有效期随资源调度而变化,不作硬性保证。
警告
长时间运行的工作流
平台理论上对工作流的最长运行时间没有硬性限制。但强烈建议您优化工作流设计,避免不必要的长时间运行。长时间运行的工作流可能会增加任务失败的风险,并产生较高的费用。如有特殊长时间运行需求,请提前与我们沟通,以便我们评估资源情况并提供支持。
按量计费精度
- 金额计算单位为元,实际数字精度为小数点后 6 位。例如,¥0.000765。
- 运行时长计算单位为秒,实际数字精度为小数点后 3 位。例如,3029.284 秒。
- 每自然小时统计累计运行时长,结算费用;不单独计算单次调用的费用。
- 超出计费精度处理:按账期扣费时,累计金额将向下取整至小数点后 6 位。
包并发服务
ComfyUI 工作流平台包并发服务是一种全新的计费与容量保障方式,通过购买并发槽位(Concurrency Slots),您可以在 ComfyUI 工作流平台 推理服务中享受独占的并发能力,与传统的按工作流运行时长(秒数)计费方式相比,具有更好的可预测性与可控性。
注意
包并发服务需通过平台销售人员协助开通。
优势
- 优先权与稳定性:并发槽位保证了核心请求在调度中的优先执行权与更高稳定性,避免在高峰期与其他用户争夺资源。对于需要稳定服务质量的实时业务,这是最直接的优势。
- 性价比高:与云厂商的独占实例相比,并发槽位成本更低,但能提供类似的 SLA 保障。
- 费用可预测性:包并发服务提供灵活的消费方式。
- 可按工作流选择溢出策略:无限排队(零溢出成本)、不排队(立即按量,低延迟)、限时排队(在排队时长内等待空闲槽位)。
- 选择无限排队可实现仅按槽位数收取月费、锁定预算;选择不排队(立即按量)可避免等待、保障低延迟。
- 灵活可控:您可以根据业务规模灵活调整槽位数量。
服务说明
- 并发槽位定义:每个并发槽位代表 1 个正在执行的 ComfyUI 工作流 API 请求。当您购买了 10 个并发槽位,即可保证在任意时刻最多 10 个请求同时运行。
注意
并发槽位需要按版本规格购买。例如,购买大显存版 10 个并发槽位,所购并发槽位仅适用于请求已关联大显存版运行环境的工作流。
- 优先级保障:使用并发槽位的请求在调度中优先于按工作流运行时长(秒数)计费请求,能够获得更稳定的响应能力。
请求超出并发槽位时的处理
当您的请求数量超过已购买的并发槽位数时,可按工作流选择以下策略:
- 无限排队:仅在已购并发资源内处理任务。超出部分进入队列等待,直到出现空闲槽位后依序执行;不会触发按量计费。
- 不排队(立即按量):当已购并发资源全部忙碌时,新任务将立刻以按量计费方式执行,避免排队等待。
- 限时排队:可为具体工作流配置「排队时长」。使用该工作流的任务在无空闲槽位时最多排队等待该时长;等待期间一旦出现空闲槽位即刻执行。
注意
排队时长为工作流级别配置,适用于通过该工作流发起的所有请求。配置入口见工作流详情页的「任务设置」标签页,详见在线调试工作流—任务设置。
- 槽位释放:当一个占用槽位的请求完成推理并返回结果后,该槽位立即释放,可供新的请求使用。
使用限制与配额
- ComfyUI 工作流平台包并发槽位服务同样受 API 频率限制指标约束:
- RPM(每分钟请求数),详见 ComfyUI 工作流平台 API 限频
- 我们会与购买并发槽位的用户协作,合理配置上述限频参数,确保在您的业务场景下获得最顺畅的 API 使用体验。
典型使用场景
- 预算敏感型用户:希望严格控制每月支出,可选择包并发模式并拒绝多余请求,避免溢出费用。
- 低延迟业务:对实时性要求较高,可选择包并发模式,超出请求转按量付费,保证请求响应速度。
- 混合型需求:既有实时延迟敏感业务,也有低敏感非关键任务,可使用灵活的购买策略。例如:
- 为实时延迟敏感业务接入支持包并发槽位的版本规格。
- 低敏感非关键任务仍接入仅按量付费的版本规格。
计费适用范围
以下入口会产生计费,按所选计费模式(按量/包并发)结算:
- 通过 ComfyUI 工作流 API 调用工作流
- 在页面上试运行工作流的运行时长(使用试运行按钮,或使用原生 ComfyUI 编辑器)
- 具体单价以工作流绑定的运行环境(版本规格)为准
不计费范围
以下场景不产生费用:
- 数据存储:输入图片存储,出图结果存储、私有模型存储等暂不纳入计费范围。
在线充值
您可以在费用中心自助充值。
费用查看
智算云平台费用中心提供了租户的流水、充值入口,及所有服务的订单、月账单、明细等信息。
查看实时费用
ComfyUI 工作流平台会在每个自然小时结束后生成账单明细。
- 采用 API 方式调用工作流后,无法查看当次调用费用,可查询当次调用记录与运行时长。具体操作参考工作流调用记录。
- 如果需要评估工作流的单次调用的费用,可使用工作流详情页的「试运行」功能。具体操作参考在线调试工作流。
试运行工作流时,可以在页面上调整工作流的参数,在任务结束后会显示当次调用的预估金额。每次调用实际费用可能会因模型加载时间、网络波动等因素略有波动。
提示
如需对照实际运行时长(计费时长)与 ComfyUI 日志输出的运行时长,可在调用记录的「执行日志」中查找以 Prompt executed … 开头的行作为近似参考,并结合「节点详情」分析节点耗时;最终计费以平台统计的运行时长为准。详见计费时长与日志对照。
查看明细账单
访问费用中心账单页面,切换到「明细账单」,产品名为「ComfyUI工作流调用」。
- 每个自然小时结束后生成账单明细,加入当前自然月的月账单中。例如,0 点-1 点的费用明细会在1点后生成,更新至当月账单中。
- 明细账单计算方式:每自然小时累计总运行时长 × 单价
- 所有时间均为北京时间 (UTC+8)。
注意
- 明细账单提供每自然小时累计费用,不单独计算单次调用的费用。
- 跨整点执行的任务计入下一个计费周期。例如,如果一个任务在 23:59:30 开始执行,并在 00:00:30 结束,则该任务的计费周期将计入 0 点-1 点的小时账单中。简单来说,以任务结束时间所在的小时为准。
查看月度账单
访问费用中心账单页面,切换到「月账单」,可查看当月累计总消费额、总余额消费情况、可开票金额。注意月账单包含当前租户所有产品服务发生的费用。
欠费处理
平台暂不支持低余额告警通知,为避免影响您的正常使用,请及时关注您的账户现金余额。避免因欠费影响线上业务。
停用功能
欠费时无法使用以下功能:
- 通过 API 执行工作流
- 试运行功能
- 创建新工作流
欠费错误提示
欠费时 API 与网页端均有相关提示:
- API 返回 HTTP 402 错误。
- 在页面上进行操作 (例如,试运行工作流、上传工作流、修改配置等) 时,平台会提示错误信息。
恢复服务
- 充值补足欠费金额
- 余额为正时自动恢复,无需人工处理(可能需要等待 5 分钟左右)
常见问题
ComfyUI 工作流托管服务是按什么计费的?
- 计费方式:按量计费,仅针对 API 请求中 ComfyUI 工作流实际运行时长收费。
- 单价:标准版价格为每秒 0.004 元人民币,大显存版价格为每秒 0.006 元人民币。
如何查看每次调用计费时长?
在调用记录中可以查看每次执行的具体开始时间、运行时长。运行时长即为实际发生计费的执行时间。执行记录会详细记录每次工作流执行的执行日志、各节点运行的耗时等,方便您进行性能分析和成本优化。执行记录中的时间均为北京时间 (UTC+8)。
注意
调用记录页面可查看计费的运行时长,不展示当次调用具体费用。
试运行会收费吗?
会,试运行与正式执行采用相同的计费标准。
试运行旨在帮助您快速验证工作流效果和预估调用金额,因此试运行也会产生费用。试运行金额仅反应当次调用金额,实际调用时,每次调用可能因模型加载时间、网络波动等因素略有波动,请以账单明细为准。
任务失败是否收费?
是的,系统会按实际运行时长收费,即使任务最终失败。
如果因 平台自身故障 导致任务失败(例如,平台服务器宕机、网络异常等),您可以联系客服申请补偿。因用户自身工作流配置错误或节点异常导致的任务失败,由于平台会消耗计算资源进行模型加载和工作流执行,即使最终结果不可用,也会按实际运行时长计费。对于因工作流配置错误或节点异常导致的任务失败,平台无法提前预判。建议您在正式使用前,充分测试和验证您的工作流配置,确保其稳定性和正确性。
如何预估费用?
试运行时会显示当次调用金额,您可以据此评估正式使用成本。
粗略估算费用:预估费用 = 平均工作流运行时长 x 单价 (0.004元/秒)
您可以通过优化工作流节点、精简模型等方式来降低执行时间,从而降低费用。 影响实际费用的因素包括但不限于:模型复杂度、节点计算量、生成图片/视频的分辨率、网络环境波动、以及偶发的系统资源竞争等。在高负载时段,实际执行时间可能会略有波动,导致最终费用略有差异,敬请谅解。更准确的费用请以实际账单为准。
模型加载时间每次都会计费吗? 如何减少模型加载费用?
模型加载时间并非每次都会发生。平台会尽可能缓存常用模型。您可以考虑以下影响因素:
- 首次使用某个工作流时,需要加载模型,此时会产生模型加载费用。
- 如果您在短时间内多次执行使用相同模型的工作流,平台通常会直接从缓存中加载模型。模型缓存有效取决于平台资源调度策略,但通常会尽可能延长缓存时间。模型缓存机制旨在为您节省重复模型加载的费用。
- 长时间未使用后再次执行:如果距离上次使用时间较长,模型可能已从缓存中释放,再次执行时可能需要重新加载模型。
余额不足暂停服务后,数据会丢失吗?我需要重新上传工作流吗?
余额不足暂停服务不会导致您的数据丢失。
您的工作流文件、配置信息、历史执行记录等数据都将完整保留。当您充值补足余额后,服务会自动恢复,您无需重新上传工作流或进行任何人工操作。
余额不足时,排队中的工作流会怎样?
租户欠费后,对于已进入队列但尚未执行的工作流,系统将 不会继续执行,并返回欠费错误提示。
是否支持设置消费限额或预算告警?
目前平台暂未提供消费限额或预算告警功能。
是否有更优惠的套餐或包月服务?
您可以考虑包并发服务。如果有大规模、高频使用的需求,欢迎联系商务或售后服务。
是否有针对大客户或高频用户的更灵活计费方案?
如果您属于大客户或高频用户,并对更灵活的计费方案感兴趣,请联系销售团队洽谈合作,我们将竭诚为您服务,提供更具竞争力的价格和更优质的服务支持。欢迎联系商务或售后服务。
如果我对计费账单有疑问或争议,如何处理?
如果您对计费账单有任何疑问或争议,请第一时间联系商务或售后服务。我们将认真核对您的账单明细和执行记录,并尽快为您解答疑问或处理争议。
请求超出并发槽位时,应该选择哪种溢出处理策略?
- 无限排队:只用已购并发,零溢出成本,延迟不可控。
- 不排队(立即按量):零排队、低延迟,超出部分按量计费。
- 限时排队:在排队时长内等待空闲槽位;等待期出现空闲即执行,兼顾成本与体验。
参见 请求超出并发槽位时的处理。
版本规格和运行环境是什么关系?为什么和价格相关?
- 版本规格对应平台提供的预置运行环境(标准版/大显存版/加速版/大显存加速)。
- 具体单价以工作流绑定的运行环境(版本规格)为准。
我可以用私有环境吗?如何计费?
- 可以。私有环境(自定义运行环境)费用不在本页在线刊例价格覆盖范围,价格请联系商务或售后。
购买超过 100 个并发有折扣吗?
- 有。超过 100 并发可获得更优惠单价,详见 包并发服务 或联系商务。