GenStudio LLM API 部分模型价格调整公告GenStudio LLM API 部分模型价格调整公告 ,新价格 2025 年 11 月 1 日生效调价公告
Skip to content

ComfyUI 工作流平台计费规则

为满足多样化的工作流推理与图像生成需求,ComfyUI 工作流平台提供按时长计费与包并发两种模式,并区分不同性能规格。您可根据业务负载与稳定性要求,自由组合,获得最优性价比。

提示

大客户或长期合作用户可联系商务或售后服务,我们将根据您的实际用量和合作情况提供包并发等其他个性化方案。

按量计费

按量计费以工作流的实际运行时长(秒)为依据,采用后付费、按自然小时出明细结算;模型加载时间计入,排队等待与数据存储不计入;优先使用代金券抵扣,超出部分从余额扣除。

刊例价

以下为 ComfyUI 工作流平台按量计费的刊例单价。

版本规格售卖方式刊例价
标准版按每个工作流的渲染/生成耗时长计费¥0.004 每秒
大显存版按每个工作流的渲染/生成耗时长计费¥0.006 每秒

按量计费规则

本节说明 ComfyUI 工作流平台按量计费定义与结算规则,包括计费口径、账期与抵扣、以及哪些时间计入/不计入费用。

  • 从工作流请求开始执行推理时起,到平台生成结果为止,定义为工作流实际运行时长(即计费时长)。
    • 如发生排队等待(指任务状态处于「排队中」),排队时长不计入实际运行时长。
    • 如工作流首次执行或模型不在缓存中时,会发生模型加载时时长,该部分时长计入计费时长。
    • 示例: 假设工作流从请求到生成结果,总共耗时 30 秒,其中排队 10 秒,则计费时长为 20 秒。
  • 失败/取消场景:
    • 任务失败:按实际运行至失败时的时长计费。
    • 用户取消:按取消发生时已消耗的运行时长计费。
  • 采用后付费模式,每自然小时生成明细账单,结算并扣费。
  • 优先采用代金券抵扣,超出部分从余额扣除。

注意

模型加载时长是指平台加载模型到计算资源所耗费的时间。为了优化成本,平台会尽可能缓存常用模型。在短时间内重复使用相同模型的工作流,模型加载时间通常只会统计一次。在缓存有效期内重复使用相同模型,通常不会重复计入加载时长;缓存有效期随资源调度而变化,不作硬性保证。

警告

长时间运行的工作流

平台理论上对工作流的最长运行时间没有硬性限制。但强烈建议您优化工作流设计,避免不必要的长时间运行。长时间运行的工作流可能会增加任务失败的风险,并产生较高的费用。如有特殊长时间运行需求,请提前与我们沟通,以便我们评估资源情况并提供支持。

按量计费精度

  • 金额计算单位为元,实际数字精度为小数点后 6 位。例如,¥0.000765。
  • 运行时长计算单位为秒,实际数字精度为小数点后 3 位。例如,3029.284 秒。
  • 每自然小时统计累计运行时长,结算费用;不单独计算单次调用的费用。
  • 超出计费精度处理:按账期扣费时,累计金额将向下取整至小数点后 6 位。

包并发服务

ComfyUI 工作流平台包并发服务是一种全新的计费与容量保障方式,通过购买并发槽位(Concurrency Slots),您可以在 ComfyUI 工作流平台 推理服务中享受独占的并发能力,与传统的按工作流运行时长(秒数)计费方式相比,具有更好的可预测性与可控性。

注意

包并发服务需通过平台销售人员协助开通。

优势

  • 优先权与稳定性:并发槽位保证了核心请求在调度中的优先执行权与更高稳定性,避免在高峰期与其他用户争夺资源。对于需要稳定服务质量的实时业务,这是最直接的优势。
  • 性价比高:与云厂商的独占实例相比,并发槽位成本更低,但能提供类似的 SLA 保障。
  • 费用可预测性:包并发服务提供灵活的消费方式。
    • 可按工作流选择溢出策略:无限排队(零溢出成本)、不排队(立即按量,低延迟)、限时排队(在排队时长内等待空闲槽位)。
    • 选择无限排队可实现仅按槽位数收取月费、锁定预算;选择不排队(立即按量)可避免等待、保障低延迟。
  • 灵活可控:您可以根据业务规模灵活调整槽位数量。

服务说明

  • 并发槽位定义:每个并发槽位代表 1 个正在执行的 ComfyUI 工作流 API 请求。当您购买了 10 个并发槽位,即可保证在任意时刻最多 10 个请求同时运行。

    注意

    并发槽位需要按版本规格购买。例如,购买大显存版 10 个并发槽位,所购并发槽位仅适用于请求已关联大显存版运行环境的工作流。

  • 优先级保障:使用并发槽位的请求在调度中优先于按工作流运行时长(秒数)计费请求,能够获得更稳定的响应能力。

请求超出并发槽位时的处理

当您的请求数量超过已购买的并发槽位数时,可按工作流选择以下策略:

  • 无限排队:仅在已购并发资源内处理任务。超出部分进入队列等待,直到出现空闲槽位后依序执行;不会触发按量计费。
  • 不排队(立即按量):当已购并发资源全部忙碌时,新任务将立刻以按量计费方式执行,避免排队等待。
  • 限时排队:可为具体工作流配置「排队时长」。使用该工作流的任务在无空闲槽位时最多排队等待该时长;等待期间一旦出现空闲槽位即刻执行。

    注意

    排队时长为工作流级别配置,适用于通过该工作流发起的所有请求。配置入口见工作流详情页的「任务设置」标签页,详见在线调试工作流—任务设置

  • 槽位释放:当一个占用槽位的请求完成推理并返回结果后,该槽位立即释放,可供新的请求使用。

使用限制与配额

  • ComfyUI 工作流平台包并发槽位服务同样受 API 频率限制指标约束:
  • 我们会与购买并发槽位的用户协作,合理配置上述限频参数,确保在您的业务场景下获得最顺畅的 API 使用体验。

典型使用场景

  • 预算敏感型用户:希望严格控制每月支出,可选择包并发模式并拒绝多余请求,避免溢出费用。
  • 低延迟业务:对实时性要求较高,可选择包并发模式,超出请求转按量付费,保证请求响应速度。
  • 混合型需求:既有实时延迟敏感业务,也有低敏感非关键任务,可使用灵活的购买策略。例如:
    • 为实时延迟敏感业务接入支持包并发槽位的版本规格。
    • 低敏感非关键任务仍接入仅按量付费的版本规格。

计费适用范围

以下入口会产生计费,按所选计费模式(按量/包并发)结算:

  • 通过 ComfyUI 工作流 API 调用工作流
  • 在页面上试运行工作流的运行时长(使用试运行按钮,或使用原生 ComfyUI 编辑器)
  • 具体单价以工作流绑定的运行环境(版本规格)为准

不计费范围

以下场景不产生费用:

  • 数据存储:输入图片存储,出图结果存储、私有模型存储等暂不纳入计费范围。

在线充值

您可以在费用中心自助充值。

费用查看

智算云平台费用中心提供了租户的流水、充值入口,及所有服务的订单、月账单、明细等信息。

查看实时费用

ComfyUI 工作流平台会在每个自然小时结束后生成账单明细。

  • 采用 API 方式调用工作流后,无法查看当次调用费用,可查询当次调用记录与运行时长。具体操作参考工作流调用记录
  • 如果需要评估工作流的单次调用的费用,可使用工作流详情页的「试运行」功能。具体操作参考在线调试工作流

试运行工作流时,可以在页面上调整工作流的参数,在任务结束后会显示当次调用的预估金额。每次调用实际费用可能会因模型加载时间、网络波动等因素略有波动。

提示

如需对照实际运行时长(计费时长)与 ComfyUI 日志输出的运行时长,可在调用记录的「执行日志」中查找以 Prompt executed … 开头的行作为近似参考,并结合「节点详情」分析节点耗时;最终计费以平台统计的运行时长为准。详见计费时长与日志对照

查看明细账单

访问费用中心账单页面,切换到「明细账单」,产品名为「ComfyUI工作流调用」。

  • 每个自然小时结束后生成账单明细,加入当前自然月的月账单中。例如,0 点-1 点的费用明细会在1点后生成,更新至当月账单中。
  • 明细账单计算方式:每自然小时累计总运行时长 × 单价
  • 所有时间均为北京时间 (UTC+8)。

注意

  • 明细账单提供每自然小时累计费用,不单独计算单次调用的费用。
  • 跨整点执行的任务计入下一个计费周期。例如,如果一个任务在 23:59:30 开始执行,并在 00:00:30 结束,则该任务的计费周期将计入 0 点-1 点的小时账单中。简单来说,以任务结束时间所在的小时为准。

查看月度账单

访问费用中心账单页面,切换到「月账单」,可查看当月累计总消费额、总余额消费情况、可开票金额。注意月账单包含当前租户所有产品服务发生的费用。

欠费处理

平台暂不支持低余额告警通知,为避免影响您的正常使用,请及时关注您的账户现金余额。避免因欠费影响线上业务。

停用功能

欠费时无法使用以下功能:

  • 通过 API 执行工作流
  • 试运行功能
  • 创建新工作流

欠费错误提示

欠费时 API 与网页端均有相关提示:

  • API 返回 HTTP 402 错误。
  • 在页面上进行操作 (例如,试运行工作流、上传工作流、修改配置等) 时,平台会提示错误信息。

恢复服务

  • 充值补足欠费金额
  • 余额为正时自动恢复,无需人工处理(可能需要等待 5 分钟左右)

常见问题

ComfyUI 工作流托管服务是按什么计费的?

  • 计费方式:按量计费,仅针对 API 请求中 ComfyUI 工作流实际运行时长收费。
  • 单价:标准版价格为每秒 0.004 元人民币,大显存版价格为每秒 0.006 元人民币。

如何查看每次调用计费时长?

在调用记录中可以查看每次执行的具体开始时间、运行时长。运行时长即为实际发生计费的执行时间。执行记录会详细记录每次工作流执行的执行日志、各节点运行的耗时等,方便您进行性能分析和成本优化。执行记录中的时间均为北京时间 (UTC+8)。

注意

调用记录页面可查看计费的运行时长,不展示当次调用具体费用。

试运行会收费吗?

会,试运行与正式执行采用相同的计费标准。

试运行旨在帮助您快速验证工作流效果和预估调用金额,因此试运行也会产生费用。试运行金额仅反应当次调用金额,实际调用时,每次调用可能因模型加载时间、网络波动等因素略有波动,请以账单明细为准。

任务失败是否收费?

是的,系统会按实际运行时长收费,即使任务最终失败。

如果因 平台自身故障 导致任务失败(例如,平台服务器宕机、网络异常等),您可以联系客服申请补偿。因用户自身工作流配置错误或节点异常导致的任务失败,由于平台会消耗计算资源进行模型加载和工作流执行,即使最终结果不可用,也会按实际运行时长计费。对于因工作流配置错误或节点异常导致的任务失败,平台无法提前预判。建议您在正式使用前,充分测试和验证您的工作流配置,确保其稳定性和正确性。

如何预估费用?

试运行时会显示当次调用金额,您可以据此评估正式使用成本。

粗略估算费用:预估费用 = 平均工作流运行时长 x 单价 (0.004元/秒)

您可以通过优化工作流节点、精简模型等方式来降低执行时间,从而降低费用。 影响实际费用的因素包括但不限于:模型复杂度、节点计算量、生成图片/视频的分辨率、网络环境波动、以及偶发的系统资源竞争等。在高负载时段,实际执行时间可能会略有波动,导致最终费用略有差异,敬请谅解。更准确的费用请以实际账单为准。

模型加载时间每次都会计费吗? 如何减少模型加载费用?

模型加载时间并非每次都会发生。平台会尽可能缓存常用模型。您可以考虑以下影响因素:

  • 首次使用某个工作流时,需要加载模型,此时会产生模型加载费用。
  • 如果您在短时间内多次执行使用相同模型的工作流,平台通常会直接从缓存中加载模型。模型缓存有效取决于平台资源调度策略,但通常会尽可能延长缓存时间。模型缓存机制旨在为您节省重复模型加载的费用。
  • 长时间未使用后再次执行:如果距离上次使用时间较长,模型可能已从缓存中释放,再次执行时可能需要重新加载模型。

余额不足暂停服务后,数据会丢失吗?我需要重新上传工作流吗?

余额不足暂停服务不会导致您的数据丢失。

您的工作流文件、配置信息、历史执行记录等数据都将完整保留。当您充值补足余额后,服务会自动恢复,您无需重新上传工作流或进行任何人工操作。

余额不足时,排队中的工作流会怎样?

租户欠费后,对于已进入队列但尚未执行的工作流,系统将 不会继续执行,并返回欠费错误提示。

是否支持设置消费限额或预算告警?

目前平台暂未提供消费限额或预算告警功能。

是否有更优惠的套餐或包月服务?

您可以考虑包并发服务。如果有大规模、高频使用的需求,欢迎联系商务或售后服务。

是否有针对大客户或高频用户的更灵活计费方案?

如果您属于大客户或高频用户,并对更灵活的计费方案感兴趣,请联系销售团队洽谈合作,我们将竭诚为您服务,提供更具竞争力的价格和更优质的服务支持。欢迎联系商务或售后服务。

如果我对计费账单有疑问或争议,如何处理?

如果您对计费账单有任何疑问或争议,请第一时间联系商务或售后服务。我们将认真核对您的账单明细和执行记录,并尽快为您解答疑问或处理争议。

请求超出并发槽位时,应该选择哪种溢出处理策略?

  • 无限排队:只用已购并发,零溢出成本,延迟不可控。
  • 不排队(立即按量):零排队、低延迟,超出部分按量计费。
  • 限时排队:在排队时长内等待空闲槽位;等待期出现空闲即执行,兼顾成本与体验。

参见 请求超出并发槽位时的处理

版本规格和运行环境是什么关系?为什么和价格相关?

  • 版本规格对应平台提供的预置运行环境(标准版/大显存版/加速版/大显存加速)。
  • 具体单价以工作流绑定的运行环境(版本规格)为准。

我可以用私有环境吗?如何计费?

  • 可以。私有环境(自定义运行环境)费用不在本页在线刊例价格覆盖范围,价格请联系商务或售后。

购买超过 100 个并发有折扣吗?

  • 有。超过 100 并发可获得更优惠单价,详见 包并发服务 或联系商务。