开发机管理
开发机是 AIStudio 提供的 Linux 开发环境,根据规格可挂载 1/2/4/8 个 GPU,用于在线编译、调试代码和模型开发。
功能亮点
- 持久化系统盘: 免费提供 50G 系统盘存储,开发机关机、重启后仍保存开发环境。
- 公网访问: 支持公网通过 SSH 远程访问开发机。
- 高可靠文件存储: 可挂载租户下的共享高性能存储,采用多副本机制,确保数据安全可靠。
- Docker 友好: 在开发机内也可以使用 Docker 命令创建容器,推送镜像。
- 资源友好: 关机后,平台会释放开发机的算力资源,确保算力高效利用。
生命周期
开发机列表页面会展示开发机在生命周期中的状态。
IMPORTANT
开发机每次启动/改配时会重新进入排队中状态。如果此时计算资源不足,可能会长时间等待资源。超时后进入异常状态。
开发机进入部署中状态后,将会执行一系列耗时的子操作(分配节点、拉取镜像等)。如果进度长期停留在部署中状态,建议查看详细部署进度。详见追踪部署进度。
针对排队中和运行中的开发机,开发机列表页面直接展示处于该状态的时长。如需详情,可使用事件监控。
基本操作
访问智算云控制台的开发机列表页面,可对开发机进行增、删、查、开机、关机等操作。
页面默认展示当前用户的开发机列表,可切换为展示当前租户下全部开发机。名称和 ID 支持模糊搜索。状态、资源池、创建者等字段支持筛选。时间字段支持排序。
- 创建开发机:详细步骤参见创建开发机。
- 登录开发机:在开发机列表中右侧操作栏中,点击直接登录开发机的 Web Terminal。
- 停止开发机:在开发机列表中右侧操作栏中。关机操作需二次确认。
- 启动开发机:在开发机列表中右侧操作栏中。启动已经停止的开发机。
- 删除开发机:在开发机列表中右侧操作栏中。删除操作需二次确认。
- 查看开发机详情:在开发机列表中右侧操作栏中,点击进入详情页面。可查看基本信息、资源规格和挂载的文件存储,监控数据。
DANGER
执行关机操作前,请确保开发机没有正在往共享高性能存储写入数据。正在写入的数据会在关机过程中被删除。
存储空间
每台开发机自带免费 50GiB 系统盘存储空间。您可以使用 df -h
命令查看的用量信息。
系统盘
为了避免您的开发环境在关机后丢失,AIStudio 为开发机系统盘(/
分区)配备了免费的持久化存储,上限 50 GiB。使用 df -h /
命令可查看系统盘用量信息。
NOTE
在开发机内使用 Docker 功能时,使用 docker run
启动的容器系统盘空间上限为 100 GiB,不支持持久化。您可以自行为容器挂载持久化存储。
扩充存储
如果需要下载大模型、数据集等,50 GiB 可能无法满足需求。开发机提供以下存储扩容方案:
- 共享高性能存储:租户下所有用户均可使用的共享存储,开发机、任务、推理服务、AICoder 均可访问。如需在开发机中使用,需在创建开发机时需创建挂载点。推荐使用免费的 AICoder 对共享高性能存储进行数据上传下载。
- 云盘:按量付费型开发机专用附加存储,提供 50GiB 免费额度,仅在创建开发机可购买扩充容量。云盘仅限所属开发机访问和使用。
登录开发机
开发机进入运行中状态后,您可以登录开发机。
Web Terminal
智算云平台支持通过 Web UI 直接登录开发机。在开发机列表页面,点击右侧操作列的登录按钮,从网页访问智算云平台的 Web Terminal 界面。
SSH 远程登录
智算云平台在创建开发机时会生成随机端口的 SSH 地址。进入开发机详情页面,可复制 SSH 地址。
SSH 远程登录支持基于密码的认证和基于 SSH 密钥的认证。
事件监控
智算云平台会记录开发机在生命周期中的所有事件,可在开发机详情页面点击查看事件。