在 AIStudio 镜像中心使用 Dockerfile 自助构建最新版 vLLM 镜像在 AIStudio 镜像中心使用 Dockerfile 自助构建最新版 vLLM 镜像 ,无需访问 DockerHub立即构建
Skip to content

开发机闲时自动关机

租户可以配置资源池规则来控制挂载 GPU 的开发机在连续空闲时自动关机。

权限要求

满足以下条件的用户可配置资源池规则。

  • 内置系统策略:
    • 租户超级管理员
  • 自定义策略:
    • 服务:资源管理
    • 操作:设置资源池规则

支持闲时自动关机规则的资源池

闲时自动关机适用于以下类型资源池。

  • 包年包月资源池专属资源池:适用于使用资源池中 GPU 计算资源创建的包年包月开发机。
  • 弹性资源池:新租户需要先使用弹性资源创建开发机才可看到弹性开发机所在可用区对应的弹性资源池。规则适用于使用同可用区 GPU 计算资源创建的弹性开发机。

单个资源池配置的规则生效后,使用资源池中 GPU 计算资源创建的开发机全部启用该规则,不支持为单个开发机配置规则或例外规则。

配置闲时自动关机规则

资源管理-资源池页面,可直接为包年包月资源池、专属资源池、弹性资源池配置规则。

注意

  • AIStudio 开发机闲时关机规则仅支持以资源池为单位进行配置,因此仅在资源管理-资源池页面提供配置入口。
  • 共享资源池不支持配置闲时关机规则。
  1. 登录控制台,访问资源池页面,选择合适类型的资源池。请根据支持闲时自动关机规则的资源池选择合适的资源池。

  2. 点击资源池右侧规则设置操作。在规则设置弹窗内执行以下操作:

    1. 确认规则名称为闲时自动关机,设置规则状态为开启

    2. 设置连续空闲状态持续时长阈值,单位可选分钟或小时。开发机连续空闲状态达到该时长后,将进入自动关机倒计时。倒计时时长可选,分别为 0、15、30、45、60(分钟)。

      注意

      • 在倒计时阶段,开发机列表页、开发机详情页均会出现倒计时提示。
      • 在倒计时阶段,点击开发机详情页顶部提示,可手动取消当次自动关机。
      • 开发机触发自动关机且关机成功后,开发机详情页事件记录标签页将增加一条「闲时自动关机」事件。

      警告

      • 规则启用(或关闭)将对使用该资源池的所有开发机生效。极端情况下,现有开发机(即历史负载)有可能在自动关机规则启用时立即批量关机。
      • 现有开发机处理方式:假设规则配置为闲置 1 小时后进入 30 分钟自动关机倒计时。如果某开发机在规则启用前已闲置 2 小时,则规则启用后,该开发机会立即进入 30 分钟自动关机倒计时。
    3. 点击确认后,查看针对历史负载的提示,进行二次确认,完成规则配置。

开发机闲置状态的定义

同时满足以下条件时,平台会判定开发机处于闲置状态,并开始计算闲置时长。

  • 开发机没有活跃的 SSH 连接
  • 开发机没有活跃的 Web Terminal 连接
  • 开发机内没有正在运行的前台或后台命令

在被判断为闲置状态后的任意时刻(包括已进入自动关机倒计时阶段的情况),只要上述条件不再满足,平台将不再认为开发机处于闲置状态,累计闲置时长清零。

取消单次自动关机

在被判断为闲置状态后的任意时刻(包括已进入自动关机倒计时阶段的情况),只要用户通过 SSH 或 Web Terminal 连接开发机,或在开发机内执行任意操作,都将取消单次自动关机。

只要资源池闲置自动关机规则中设置的倒计时时长不为 0,在开发机进入自动关机倒计时阶段后,平台将在开发机列表页、详情页对用户进行提示,并显示倒计时剩余时长。用户如需取消当次自动关机,可点击详情页顶部的取消按钮。

alt text

查看资源池的闲时自动关机规则

您可以在两处查看资源池的闲时自动关机规则配置。

  • 点击资源池列表的「规则设置」,可在弹窗中查看当前的规则配置。
  • 点击资源池详情页,「规则设置」标签页展示了当前的规则配置。