GPU 资源占用情况
GPU 资源占用情况为租户管理员提供资源池中各节点的 GPU 使用详情,包括节点级别的 GPU 分配、负载占用信息及创建者身份。此功能用于资源监控、容量规划和团队资源协调。
注意
资源占用情况用于追踪租户已购包年包月资源在组织内的分配与使用情况,因此仅适用于包年包月资源池、专属资源池、共享资源池。其他类型资源池不支持查看资源占用情况。
概述
多数 AI/ML 工作负载需要单个节点上的连续 GPU 资源。例如,8 卡训练任务无法在多个节点上分散运行。即使资源池总空闲 GPU 数量充足,如果分散在多个节点上,也无法满足多卡工作负载需求。
GPU 资源占用情况视图提供节点级别的 GPU 分配详情,用于确认连续资源可用性、追踪资源使用者和协调团队资源分配。
访问方式
- 访问平台资源管理-资源池页面,点击列表中的资源池(包年包月资源池、专属资源池、或共享资源池),进入资源池详情页。
- 在资源池详情页,切换到资源列表标签页,在资源节点记录右侧的负载信息列中点击详情按钮。
界面说明
资源占用情况视图以抽屉形式展示,包含三个层级的信息:资源概览、节点列表和负载详情。

资源概览
顶部汇总显示资源池中指定规格的 GPU 总体使用情况。
| 字段 | 说明 |
|---|---|
| 显卡型号和规格 | GPU 的完整型号信息,例如 NVIDIA A100-80G NVLink |
| 总卡数 | 资源池中该规格的 GPU 总数量 |
| 已用 | 当前被工作负载占用的 GPU 数量 |
| 未用 | 当前空闲可分配的 GPU 数量 |
| 不可用 | 处于故障、维护或其他不可用状态的 GPU 数量 |
节点列表
按节点规格分组展示(例如"8卡资源,共3台"),列出资源池中的所有节点。每个节点卡片包含:
| 字段 | 说明 |
|---|---|
| 已用卡数 | 该节点上被工作负载占用的 GPU 数量 |
| 未用卡数 | 该节点上空闲可用的 GPU 数量 |
| 使用详情 | 点击展开后显示该节点上所有负载的详细信息表格 |
节点卡片按使用情况显示不同颜色的进度条。全部占用时显示红色,部分占用显示橙色,完全空闲显示绿色。
负载详情表
点击资源节点的使用详情后展开,显示该节点上运行的所有工作负载。
包年包月资源池、专属资源池展示如下字段:
| 字段 | 说明 |
|---|---|
| 负载名称/ID | 工作负载的名称和系统唯一标识符 |
| 负载类型 | 工作负载类型,包括:开发机、推理服务、训练任务等 |
| 占用显卡数 | 该负载在此节点上占用的 GPU 数量 |
| 创建者 | 创建该工作负载的用户账号 |
| 创建时间 | 工作负载的创建时间戳,格式为 YYYY-MM-DD HH:MM:SS |
共享资源池展示如下字段:
| 字段 | 说明 |
|---|---|
| 负载名称/ID | 工作负载的名称和系统唯一标识符 |
| 负载类型 | 工作负载类型,包括:开发机、推理服务、训练任务等 |
| 占用显卡与显存占比 | 展示共享开发机当前占用的全部显卡编号(如 GPU0),并按显卡展示当前显存占用量与卡显存总容量比值 |
| 创建者 | 创建该工作负载的用户账号 |
| 创建时间 | 工作负载的创建时间戳,格式为 YYYY-MM-DD HH:MM:SS |

注意
资源池不可跨可用区调配。停止或删除他人工作负载前需与创建者沟通,确保数据已保存至共享存储。资源需求持续较高时导致资源争抢时,建议创建专属资源池。