AIStudio 2025年夏季(6-8月)重要功能更新回顾 ☀️
2025-08-04
2025 年 6–8 月期间,一站式 AI 平台 (AIStudio) 聚焦 企业级治理、批量效率、运维诊断、资源精细调度、镜像与权限生态 等方向进行了多轮迭代。本文按主题梳理重点能力,帮助你快速把握本季度(夏季)提升点。
核心治理与安全合规
全新权限系统(06-23)
- 支持授权对象:用户 / 用户组
- 支持授权维度:我的 / 指定资源池 / 指定资源 / 全部
- 策略灵活组合,兼容历史授权并自动迁移
- 建议迁移完成后按组织架构和资源规划二次优化
调度精细化与算力利用
多服务批量操作(06-23)
- 「开发机」「推理服务」「任务」均支持批量操作
- 「任务」新增任务组:一次创建多任务 & 汇总监控查看
工作负载节点绑定(06-18)
- 创建开发机 / 任务 / 推理服务时可固定到目标节点
- 适合特定硬件(如特定 GPU 型号 / RDMA 拓扑)或隔离需求场景
- 提升资源确定性,但需关注节点故障风险
RDMA 配置开关(06-05)
- 「开发机」「任务」「推理服务」可显式选择是否挂载 RDMA 设备
- 仅在训练网为 RoCE / IB 时可见
- 建议 < 8 卡规格默认关闭,减少不必要配置开销
可观测性与诊断
日志检索与导出(06-05)
- 「任务」「推理服务」「镜像」支持日志搜索与导出
- 提升问题定位、合规留存与审计效率
atlctl 调试工具增强(08-04)
- 新增
taint
:为单任务级别设置污点节点(精准调度调试) - 新增
delete
:在任务内部删除 Pod,便于局部恢复 / 复现问题
监控与可用性体验
- 资源统计:人员统计仅统计运行中负载(6-05)
- 高并发推理性能优化(6-05)
- 扩缩容状态显示异常修复(6-05)
镜像与环境生态
镜像中心改版(08-04)
- 上架多种主流框架官方 / 优化版本镜像
- 提供完善筛选机制(标签 / 框架 / 版本等)
镜像选择体验优化(07-14)
- 状态栏支持多选
- 自定义镜像下拉分页加载,降低长列表性能压力
持久化容器与镜像(08-04)
- 「开发机」支持持久化保存 Docker 容器与镜像(使用系统盘)
- 配合系统盘扩容(100GiB),满足多框架调试与多阶段实验需求
开发生产一体效率
系统盘扩容(08-04)
- 「开发机」系统盘提升至 100GiB,更适配多框架 / 多数据集研发周期
运行前灵活自检(07-14)
- 「任务」开机检测不再强制全量执行,可通过环境变量自由选择
企业与账号能力
企业认证自助化(07-14)
- 「账号管理」页面支持企业自助完成认证,降低开户与准入沟通成本
面向不同角色的价值速览
- 平台管理员:权限体系统一 + 节点绑定 → 更清晰的资源治理模型
- 算法工程师:持久化镜像 / 容器 + 系统盘扩容 → 多实验并行更顺畅
- 运维 / SRE:日志检索导出 + 可选检测项 → 故障定位更快、启动更灵活
- 业务负责人:批量任务 & 任务组 → 成本与迭代周期可视化更好
- 企业合规:企业认证自助化 + 访问控制细粒度 → 减少对接成本
注意
以上内容为 2025 年 6–8 月期间功能要点整合,细节及后续新增请查阅 AIStudio 更新日志。
提示
若需开通节点绑定、特定镜像或高级调试能力,请联系售后或平台支持团队。