在 AIStudio 镜像中心使用 Dockerfile 自助构建最新版 vLLM 镜像在 AIStudio 镜像中心使用 Dockerfile 自助构建最新版 vLLM 镜像 ,无需访问 DockerHub立即构建
Skip to content

2025年冬季(11–12月)重要功能更新回顾 ❄️

2025-12-31

2025 年 11–12 月期间,我们围绕大模型服务平台(GenStudio)、一站式 AI 平台(AIStudio)、智能体服务平台(Agent Platform)与极值算力(OptiCompute)进行了多项升级。本篇按主题梳理自 11 月 1 日以来的关键更新,帮助您快速把握冬季(11–12 月)能力变化。

核心亮点

  • 智能体服务平台正式上线,为 AI 应用开发者提供完整的 Agentic Infra 能力;
  • 新增 DeepSeek V3.2、GLM 4.7、Minimax m2.1 等多款 SOTA 模型;
  • 推理服务集成 vLLM/SGLang 业务指标监控;
  • 任务支持 Ray 分布式框架与容错优化;
  • 存储监控与限额管理全面升级。

模型矩阵与 API 能力升级(GenStudio)

大模型服务平台新增多款国产优秀模型并下架部分过时模型,持续为用户提供 SOTA 模型能力与多样化选择。

新增模型与版本

  • 12-24:上线 Minimax 大语言模型。
    • minimax-m2.1
  • 12-23:上线智谱 GLM 大语言模型。
    • glm-4.7
  • 12-10:上线智谱 GLM 多模态模型。
    • glm-4.6v
  • 12-02:上线 DeepSeek V3.2 系列模型,支持思考(Reasoning)与非思考模式。
    • deepseek-v3.2(非思考模式)
    • deepseek-v3.2-thinking(思考模式)
  • 11-06:上线 DeepSeek-OCR 模型,支持文档识别场景。
    • deepseek-ocr

API 兼容性与模型优化

  • 11-21:支持 Anthropic 兼容的 Messages 接口,暂支持部分模型(glm-4.6glm-4.5minimax-m2 等),最新支持情况请以 GenStudio 模型广场「Claude 兼容」筛选结果为准。

智能体服务能力(Agent Platform)

智能体服务平台于冬季正式发布,为企业和开发者提供下一代 Agentic Infra 能力。

平台正式上线

  • 12-15:智能体服务平台正式上线。基于下一代 Agentic Infra 范式构建,不仅提供智能体托管,更致力于为智能体构建完整的体验——赋予其大脑(SOTA 模型调度)、双手(MCP 工具链与环境)和记忆(上下文管理),帮助企业和开发者跨越技术门槛,构建具备自主决策能力的顶尖应用。

推理服务与监控增强(AIStudio)

一站式 AI 平台强化推理服务监控能力,提供业务级 LLM 指标可视化,助力生产环境稳定运行。

推理服务监控

  • 12-05:「推理服务」监控功能支持采集 vLLM/SGLang 输出的 LLM 监控指标,如 QPS、TTFT、TPOT 等,并进行可视化展示。便于团队实时掌握推理服务性能表现,快速定位瓶颈。

存储与可观测性升级(AIStudio & OptiCompute)

一站式 AI 平台与极值算力均新增存储监控能力,提升资源使用透明度与问题排查效率。

存储监控与限额管理

  • 12-01:支持对共享存储存储卷设置容量和 inode 限额。允许对使用一级目录(例如 /public)的存储卷添加限额配置,使用二级目录及以下路径的存储卷自动适用上级目录限额。
  • 11-17:「开发机」「任务」「推理服务」「极值算力容器实例」详情页新增存储监控指标,支持查看系统盘和挂载的文件存储的读写速度、IOPS 等指标。
  • 11-17:更多可用区支持自助删除存储卷。

任务与开发机能力强化(AIStudio & OptiCompute)

任务容错、启动自定义、规格扩展等多项改进,提升研发与生产效率。

任务功能优化

  • 12-15:「任务」支持在训练任务运行中修改任务可视化路径(平台读取 Tensorboard 日志的路径)。提交修改后,平台将重启 Tensorboard 看板。
  • 12-15:「任务」在新建、重跑时,可将网页上的环境变量设置为仅创建人可见,保障敏感信息安全。
  • 12-15:优化包年包月资源池「优先调度队列」中负载的调度优先级计算策略。优化后,因下列情况产生的调度请求优先处理:任务容错导致的重调度、任务重跑、开发机改配、推理服务 Worker 重建。
  • 12-01:使用「任务」容错 ATLAS_ACTIVATE_ENV 环境变量添加的自定义配置(例如激活 Python 虚拟环境)对任务容错调试命令 atlctl check/atlctl burn 生效。
  • 12-01:「任务」容错调试命令 atlctl check/atlctl burn 支持将日志重定向到文件。
  • 12-01:「任务」「推理服务」日志展示功能支持解析颜色控制码,提升日志可读性。
  • 11-17:「任务」支持 Ray 分布式框架。
  • 11-17:「任务」新增环境变量 ATLAS_ACTIVATE_ENV,可为容错的 Bootcheck(启动检测)和 Troubleshoot(异常定位)阶段添加自定义配置(例如激活 Python 虚拟环境)。

开发机与极值算力增强

  • 12-01:「开发机」「推理服务」支持 0 卡规格(仅在部分可用区支持)。0 卡规格指不包含 GPU 卡,仅使用 CPU、内存的算力规格。仅包年包月资源池支持 0 卡规格。
  • 11-17:「开发机」「极值算力容器实例」支持启动命令,可用于服务自启动。

注意

以上内容为 2025 年 11–12 月期间功能要点整合,细节及后续新增请查阅各产品更新日志: