2025年冬季（11–12月)重要功能更新回顾 ❄️

2025-12-31

2025 年 11–12 月期间，我们围绕大模型服务平台（GenStudio）、一站式 AI 平台（AIStudio）、智能体服务平台（Agent Platform）与极值算力（OptiCompute）进行了多项升级。本篇按主题梳理自 11 月 1 日以来的关键更新，帮助您快速把握冬季（11–12 月）能力变化。

核心亮点：

智能体服务平台正式上线，为 AI 应用开发者提供完整的 Agentic Infra 能力；
新增 DeepSeek V3.2、GLM 4.7、Minimax m2.1 等多款 SOTA 模型；
推理服务集成 vLLM/SGLang 业务指标监控；
任务支持 Ray 分布式框架与容错优化；
存储监控与限额管理全面升级。

模型矩阵与 API 能力升级（GenStudio）

大模型服务平台新增多款国产优秀模型并下架部分过时模型，持续为用户提供 SOTA 模型能力与多样化选择。

新增模型与版本

12-24：上线 Minimax 大语言模型。
- minimax-m2.1
12-23：上线智谱 GLM 大语言模型。
- glm-4.7
12-10：上线智谱 GLM 多模态模型。
- glm-4.6v
12-02：上线 DeepSeek V3.2 系列模型，支持思考（Reasoning）与非思考模式。
- deepseek-v3.2（非思考模式）
- deepseek-v3.2-thinking（思考模式）
11-06：上线 DeepSeek-OCR 模型，支持文档识别场景。
- deepseek-ocr

API 兼容性与模型优化

11-21：支持 Anthropic 兼容的 Messages 接口，暂支持部分模型（glm-4.6、glm-4.5、minimax-m2 等），最新支持情况请以 GenStudio 模型广场「Claude 兼容」筛选结果为准。

智能体服务能力（Agent Platform）

智能体服务平台于冬季正式发布，为企业和开发者提供下一代 Agentic Infra 能力。

平台正式上线

12-15：智能体服务平台正式上线。基于下一代 Agentic Infra 范式构建，不仅提供智能体托管，更致力于为智能体构建完整的体验——赋予其大脑（SOTA 模型调度）、双手（MCP 工具链与环境）和记忆（上下文管理），帮助企业和开发者跨越技术门槛，构建具备自主决策能力的顶尖应用。

推理服务与监控增强（AIStudio）

一站式 AI 平台强化推理服务监控能力，提供业务级 LLM 指标可视化，助力生产环境稳定运行。

推理服务监控

12-05：「推理服务」监控功能支持采集 vLLM/SGLang 输出的 LLM 监控指标，如 QPS、TTFT、TPOT 等，并进行可视化展示。便于团队实时掌握推理服务性能表现，快速定位瓶颈。

存储与可观测性升级（AIStudio & OptiCompute）

一站式 AI 平台与极值算力均新增存储监控能力，提升资源使用透明度与问题排查效率。

存储监控与限额管理

12-01：支持对共享存储存储卷设置容量和 inode 限额。允许对使用一级目录（例如 /public）的存储卷添加限额配置，使用二级目录及以下路径的存储卷自动适用上级目录限额。
11-17：「开发机」「任务」「推理服务」「极值算力容器实例」详情页新增存储监控指标，支持查看系统盘和挂载的文件存储的读写速度、IOPS 等指标。
11-17：更多可用区支持自助删除存储卷。

任务与开发机能力强化（AIStudio & OptiCompute）

任务容错、启动自定义、规格扩展等多项改进，提升研发与生产效率。

任务功能优化

12-15：「任务」支持在训练任务运行中修改任务可视化路径（平台读取 Tensorboard 日志的路径）。提交修改后，平台将重启 Tensorboard 看板。
12-15：「任务」在新建、重跑时，可将网页上的环境变量设置为仅创建人可见，保障敏感信息安全。
12-15：优化包年包月资源池「优先调度队列」中负载的调度优先级计算策略。优化后，因下列情况产生的调度请求优先处理：任务容错导致的重调度、任务重跑、开发机改配、推理服务 Worker 重建。
12-01：使用「任务」容错 ATLAS_ACTIVATE_ENV 环境变量添加的自定义配置（例如激活 Python 虚拟环境）对任务容错调试命令 atlctl check/atlctl burn 生效。
12-01：「任务」容错调试命令 atlctl check/atlctl burn 支持将日志重定向到文件。
12-01：「任务」「推理服务」日志展示功能支持解析颜色控制码，提升日志可读性。
11-17：「任务」支持 Ray 分布式框架。
11-17：「任务」新增环境变量 ATLAS_ACTIVATE_ENV，可为容错的 Bootcheck（启动检测）和 Troubleshoot（异常定位）阶段添加自定义配置（例如激活 Python 虚拟环境）。

开发机与极值算力增强

12-01：「开发机」「推理服务」支持 0 卡规格（仅在部分可用区支持）。0 卡规格指不包含 GPU 卡，仅使用 CPU、内存的算力规格。仅包年包月资源池支持 0 卡规格。
11-17：「开发机」「极值算力容器实例」支持启动命令，可用于服务自启动。

注意

以上内容为 2025 年 11–12 月期间功能要点整合，细节及后续新增请查阅各产品更新日志：

产品简介

访问 AICoder

传输文件

账号与权限

凭证管理

费用中心

通知中心

算力资源池管理

高性能存储管理

镜像中心

开发机

训练任务

推理部署

存储服务

企业服务

极值算力

AI 容器服务平台

预置模型

大语言模型 API

向量嵌入与重排序

计费与支持

ComfyUI 工作流托管

API 调用

监控与计费

产品简介

使用指南

2025年冬季（11–12月)重要功能更新回顾 ❄️

模型矩阵与 API 能力升级（GenStudio）

新增模型与版本

API 兼容性与模型优化

智能体服务能力（Agent Platform）

平台正式上线

推理服务与监控增强（AIStudio）

推理服务监控

存储与可观测性升级（AIStudio & OptiCompute）

存储监控与限额管理

任务与开发机能力强化（AIStudio & OptiCompute）

任务功能优化

开发机与极值算力增强

2025年冬季（11–12月)重要功能更新回顾 ❄️ ​

模型矩阵与 API 能力升级（GenStudio） ​

新增模型与版本 ​

API 兼容性与模型优化 ​

智能体服务能力（Agent Platform） ​

平台正式上线 ​

推理服务与监控增强（AIStudio） ​

推理服务监控 ​

存储与可观测性升级（AIStudio & OptiCompute） ​

存储监控与限额管理 ​

任务与开发机能力强化（AIStudio & OptiCompute） ​

任务功能优化 ​

开发机与极值算力增强 ​

2025年冬季（11–12月)重要功能更新回顾 ❄️

模型矩阵与 API 能力升级（GenStudio）

新增模型与版本

API 兼容性与模型优化

智能体服务能力（Agent Platform）

平台正式上线

推理服务与监控增强（AIStudio）

推理服务监控

存储与可观测性升级（AIStudio & OptiCompute）

存储监控与限额管理

任务与开发机能力强化（AIStudio & OptiCompute）

任务功能优化

开发机与极值算力增强