扩充存储
在 AIStudio 中,除了系统盘(预置存储)外,您还可以为开发机扩充存储空间,满足更大数据量或多样化场景的需求。扩充存储主要包括「云盘」和「共享高性能存储」两种类型。
云盘 vs 共享高性能存储
特性 | 云盘 | 共享高性能存储 |
---|---|---|
多用户共享 | 单机专用 | 租户共享 |
开发机支持 | 仅按量付费型 | 全部类型 |
任务/推理服务 | ❌ | ✅ |
AICoder 访问 | ❌ | ✅ |
免费额度 | 20 GiB | 无 |
扩容方式 | 创建时购买 | 联系商务 |
数据持久化 | 删除开发机时丢失 | 永久保存 |
适合场景 | 个人开发 | 团队协作 |
云盘
「云盘」是基于分布式块存储的持久化存储产品,具有高可靠、高可用、高性能的特点。
购买云盘容量
在使用「弹性资源池」开发机时,存储配置区域会自动展示开发机的云盘配置信息。单台开发机免费提供 20GiB 的云盘存储空间。
提示
- 云盘当前仅支持按量付费型开发机。
- 暂仅支持在创建开发机扩大云盘容量,如需更大云盘容量,请务必在创建开发机规划好云盘容量,并选择需要扩容。后续将支持付费扩容已有云盘。
如果需要更多云盘存储空间,请在创建开发机时选中需要扩容,输入额外购买的容量值。
访问云盘
云盘将自动挂载至开发机内部的 /datadisk
路径下,无需手动配置。
注意
- 云盘访问路径
/datadisk
不可修改。 - 云盘非共享存储,创建开发机时购买的云盘仅供当前开发机使用。
- AICoder 无法挂载任何开发机的云盘。
监测云盘用量
您可以从开发机详情页面查看云盘的用量数据。
注意
云盘用量数据展示包含当前开发机云盘本身开销的用量。云盘容量越大,开销会更多。
云盘性能
云盘的性能测试结果如下,仅供参考:
- IOPS:48000(写),74000(读)
- 带宽:600 MB/S(写),1.7GB/S(读),
- 随机写时延:234 us
共享高性能存储
共享高性能存储是一种可被多个开发机、任务、推理服务同时挂载和访问的高性能文件存储,适合团队协作和大规模数据处理场景。支持基于用户/用户组的操作权限控制和挂载权限管理。
高性能存储与可用区
AIStudio 在多个地理位置部署了集群,每个可用区的高性能存储相互独立。在某个可用区购买的高性能存储,仅能被该可用区的服务实例使用。
购买共享高性能存储
租户可购买共享高性能存储,用于租户下所有成员共享文件,在开发机、推理和任务、AICoder、AI 容器服务集群中均可使用。
提示
共享高性能存储暂不支持线上购买,如需购买,请联系商务。
挂载与访问高性能存储
一站式 AI 平台中的服务与 AICoder 均可挂载高性能存储的存储卷,便于在大数据量情况下高效地协作和复用数据。
租户购买某个可用区的高性能存储后,建议由租户超级管理员创建存储卷,并合理规划和配置支持基于用户/用户组的操作权限控制和挂载权限。
注意
- 共享高性能存储仅能被当前可用区的容器实例挂载。例如,可用区 A 的开发机、推理服务、任务、AICoder 不可跨可用区挂载可用区 B 的共享高性能存储。
- 租户超级管理员可通过权限控制用户/用户组是否有权查看、读写特定存储卷。
- 已被授权读写存储卷的用户,可在挂载存储卷时自行选择在容器中挂载为只读卷或可读写卷。
传输数据
传输数据至云盘
由于开发机的云盘仅可在开发机运行时访问,因此如果需要从本地设备传输数据到云盘,必须使用云盘所属的开发机。
在支持云盘的开发机中,云盘访问路径为 /datadisk
。
详细步骤参考 通过开发机传输文件。
传输数据至共享高性能存储
共享高性能存储可被同一可用区的容器实例挂载,因此您可以使用开发机或 AICoder 挂载共享高性能存储后传输数据。
在启动开发机或 AICoder 时,您需要手动指定挂载共享高性能存储的卷和容器内的挂载点。
详细步骤参考:
注意
AICoder 是免费提供的小规格 CPU 实例。我们建议您使用同一可用区的 AICoder 传输数据,避免占用 GPU 资源。
数据传输工具
目前支持的本地数据传输方案都基于 SSH,默认支持命令行界面下 2 种常用的文件传输方案,即 scp
和 sftp
。
提示
开发机支持 SSH 用户名/密码认证,也支持基于 SSH 密钥的认证。请提前确认可成功 SSH 远程登录开发机。如需帮助,请参考 SSH 远程登录。
常见问题
云盘容量如何扩容?
暂仅支持在创建开发机通过需要扩容选项购买额外的云盘容量。
如需大于 20GB 的云盘容量,请务必提前规划好云盘容量,并在创建开发机时选中需要扩容。
后续将支持为已有开发机扩容云盘,敬请期待。
为什么我没有云盘?
当前仅支持使用「弹性资源池」创建的开发机,即按量付费型开发机。请检查在创建开发机时是否选择「弹性资源池」。
旧版开发机实例需要「改配」或关机后重新启动才能使用云盘。
云盘数据如何共享?
不支持。云盘非共享存储,仅供当前开发机使用,数据不会共享。
如果需要在不同实例间共享数据,可购买共享高性能存储。
云盘可以在多个开发机间共享吗?
不可以,云盘为非共享存储,仅限单台开发机挂载使用。
如果在开发机关机时访问云盘?
不支持。云盘暂仅供当前开发机使用,仅在开发机开机时可访问云盘。
AICoder 无法挂载开发机的云盘,因此您无法在开发机关机时通过 AICoder 读写云盘。
云盘如何计费?
我们为使用「弹性资源池」创建的开发机(即按量付费型开发机)免费提供 20 GiB 的云盘存储空间。
超过 20 GiB 的云盘存储空间,按 0.007 元/GiB/日 计费。开发机关机后,云盘依然计费。开发机删除后,云盘存储空间将删除和释放。
哪种存储适合存放团队共享的数据?
目前共享高性能存储支持服务共享访问,且提供高性能访问(30k IOPS)。
如何在不同服务间共享数据?
可以使用共享高性能存储(/mnt/public
),它支持在开发机、任务和推理服务间共享数据。
存储服务的文件数量有限制吗?
文件数量对应文件系统的 inode 数量,每个文件或目录都会占用一个 inode。软链接同样会占用一个 inode。
- 对于 AIStudio 的开发机、任务、推理服务的本地存储,建议使用
df -i /
监控 inode 使用情况。 - 对于云盘,建议使用
df -i /datadisk
监控 inode 使用情况。 - 对于共享高性能存储,暂无法直接获取 inode 使用情况。参考限制为每 10TB 存储空间上限 1 亿个文件。如遇到疑似 inode 耗尽问题,请联系商务或售后服务。
警告
如果您的使用场景对 inode 数量有较高要求,建议提前咨询商务或售后服务。
共享高性能存储可以在所有服务中使用吗?
是的,可以在开发机、推理服务、任务、AICoder 中使用,默认挂载在 /mnt/public
目录下。
其中 AICoder 为免费提供的 CPU 实例,使用 AICoder 读写共享文件存储数据,可避免占用 GPU 资源。
我在北京可用区购买了高性能存储,为什么上海可用区的开发机无法挂载?
高性能存储具有可用区隔离特性,北京可用区的存储仅能被北京可用区的服务实例使用。如需在上海可用区使用存储,请在上海可用区单独购买。
如何在不同可用区间共享高性能存储数据?
目前不支持跨可用区直接共享存储。如需在不同可用区间传输数据,可以:
- 通过开发机的公网 IP 进行数据传输
- 自行使用对象存储等支持跨区域访问的存储服务
- 联系技术支持获取数据迁移方案