2025年冬季(11–12月)重要功能更新回顾 ❄️
2025-12-31
2025 年 11–12 月期间,我们围绕大模型服务平台(GenStudio)、一站式 AI 平台(AIStudio)、智能体服务平台(Agent Platform)与极值算力(OptiCompute)进行了多项升级。本篇按主题梳理自 11 月 1 日以来的关键更新,帮助您快速把握冬季(11–12 月)能力变化。
核心亮点:
- 智能体服务平台正式上线,为 AI 应用开发者提供完整的 Agentic Infra 能力;
- 新增 DeepSeek V3.2、GLM 4.7、Minimax m2.1 等多款 SOTA 模型;
- 推理服务集成 vLLM/SGLang 业务指标监控;
- 任务支持 Ray 分布式框架与容错优化;
- 存储监控与限额管理全面升级。
模型矩阵与 API 能力升级(GenStudio)
大模型服务平台新增多款国产优秀模型并下架部分过时模型,持续为用户提供 SOTA 模型能力与多样化选择。
新增模型与版本
- 12-24:上线 Minimax 大语言模型。
minimax-m2.1
- 12-23:上线智谱 GLM 大语言模型。
glm-4.7
- 12-10:上线智谱 GLM 多模态模型。
glm-4.6v
- 12-02:上线 DeepSeek V3.2 系列模型,支持思考(Reasoning)与非思考模式。
deepseek-v3.2(非思考模式)deepseek-v3.2-thinking(思考模式)
- 11-06:上线 DeepSeek-OCR 模型,支持文档识别场景。
deepseek-ocr
API 兼容性与模型优化
- 11-21:支持 Anthropic 兼容的 Messages 接口,暂支持部分模型(
glm-4.6、glm-4.5、minimax-m2等),最新支持情况请以 GenStudio 模型广场「Claude 兼容」筛选结果为准。
智能体服务能力(Agent Platform)
智能体服务平台于冬季正式发布,为企业和开发者提供下一代 Agentic Infra 能力。
平台正式上线
- 12-15:智能体服务平台正式上线。基于下一代 Agentic Infra 范式构建,不仅提供智能体托管,更致力于为智能体构建完整的体验——赋予其大脑(SOTA 模型调度)、双手(MCP 工具链与环境)和记忆(上下文管理),帮助企业和开发者跨越技术门槛,构建具备自主决策能力的顶尖应用。
推理服务与监控增强(AIStudio)
一站式 AI 平台强化推理服务监控能力,提供业务级 LLM 指标可视化,助力生产环境稳定运行。
推理服务监控
- 12-05:「推理服务」监控功能支持采集 vLLM/SGLang 输出的 LLM 监控指标,如 QPS、TTFT、TPOT 等,并进行可视化展示。便于团队实时掌握推理服务性能表现,快速定位瓶颈。
存储与可观测性升级(AIStudio & OptiCompute)
一站式 AI 平台与极值算力均新增存储监控能力,提升资源使用透明度与问题排查效率。
存储监控与限额管理
- 12-01:支持对共享存储存储卷设置容量和 inode 限额。允许对使用一级目录(例如
/public)的存储卷添加限额配置,使用二级目录及以下路径的存储卷自动适用上级目录限额。 - 11-17:「开发机」「任务」「推理服务」「极值算力容器实例」详情页新增存储监控指标,支持查看系统盘和挂载的文件存储的读写速度、IOPS 等指标。
- 11-17:更多可用区支持自助删除存储卷。
任务与开发机能力强化(AIStudio & OptiCompute)
任务容错、启动自定义、规格扩展等多项改进,提升研发与生产效率。
任务功能优化
- 12-15:「任务」支持在训练任务运行中修改任务可视化路径(平台读取 Tensorboard 日志的路径)。提交修改后,平台将重启 Tensorboard 看板。
- 12-15:「任务」在新建、重跑时,可将网页上的环境变量设置为仅创建人可见,保障敏感信息安全。
- 12-15:优化包年包月资源池「优先调度队列」中负载的调度优先级计算策略。优化后,因下列情况产生的调度请求优先处理:任务容错导致的重调度、任务重跑、开发机改配、推理服务 Worker 重建。
- 12-01:使用「任务」容错
ATLAS_ACTIVATE_ENV环境变量添加的自定义配置(例如激活 Python 虚拟环境)对任务容错调试命令atlctl check/atlctl burn生效。 - 12-01:「任务」容错调试命令
atlctl check/atlctl burn支持将日志重定向到文件。 - 12-01:「任务」「推理服务」日志展示功能支持解析颜色控制码,提升日志可读性。
- 11-17:「任务」支持 Ray 分布式框架。
- 11-17:「任务」新增环境变量
ATLAS_ACTIVATE_ENV,可为容错的 Bootcheck(启动检测)和 Troubleshoot(异常定位)阶段添加自定义配置(例如激活 Python 虚拟环境)。
开发机与极值算力增强
- 12-01:「开发机」「推理服务」支持 0 卡规格(仅在部分可用区支持)。0 卡规格指不包含 GPU 卡,仅使用 CPU、内存的算力规格。仅包年包月资源池支持 0 卡规格。
- 11-17:「开发机」「极值算力容器实例」支持启动命令,可用于服务自启动。
注意
以上内容为 2025 年 11–12 月期间功能要点整合,细节及后续新增请查阅各产品更新日志: