2025年秋季(9–10月)重要功能更新回顾 ☀️
2025-10-17
2025 年 9–10 月期间,我们围绕大模型服务平台(GenStudio)、一站式 AI 平台(AIStudio)与 AI 容器服务平台(KubeStudio)进行了多项升级。本篇按主题梳理自 9 月 1 日以来的关键更新,帮助您快速把握秋季(9–10 月)能力变化。
模型矩阵与 API 能力升级(GenStudio)
大模型服务平台提供了新模型矩阵 + enable_thinking
开关,更丰富的选择与可控性,便于实验评估与线上业务迁移。
新增模型与版本
- 09-30:上线 DeepSeek 与 GLM 系列模型,支持体验中心与 API 调用。
deepseek-v3.2-exp
glm-4.6
- 09-28:上线 Qwen3-VL 多模态模型。
qwen3-vl-235b-a22b-instruct
qwen3-vl-235b-a22b-thinking
- 09-20:上线 DeepSeek 系列模型。
deepseek-v3.1-terminus
- 09-12:上线 Qwen Next 系列模型。
qwen3-next-80b-a3b-instruct
qwen3-next-80b-a3b-thinking
推理可控性与版本更新
- 09-08:部分模型支持通过
enable_thinking
参数开启/关闭推理能力。- 适用模型:
deepseek-v3.1
、qwen3-8b
、qwen3-32b
、qwen3-30b-a3b
、qwen3-235b-a22b
、glm-4.5
、glm-4.5-air
、glm-4.5v
- 适用模型:
- 09-05:
kimi-k2-instruct
更新为 Kimi K2 0905 版本,模型 ID 保持不变,能力与上下文长度提升至 256K。
资源与存储管理(AIStudio)
一站式 AI 平台实现资源标签治理和云盘独立生命周期。
资源标签与云盘增强
- 新增资源标签能力:以 KV 键值对(如
demo:llm
)对「开发机」「任务」「推理服务」「镜像」进行分类聚合。 - AIStudio 开发机改配时支持云盘扩容,并支持释放(删除)云盘;无需删除关联的弹性开发机即可单独删除云盘。
高性能共享文件存储
- 支持线上自助购买高性能共享文件存储、创建文件系统、查看容量与 inode 使用情况,并支持自助删除存储卷与文件系统(当前暂仅支持广东 B 可用区)。
集群与调度能力与成本优化(KubeStudio)
AI 容器服务平台提供了 Spot 集群、高性能共享存储自助化 hostpath 挂载,帮助您高效使用资源。
按量(Spot)资源集群
- AI 容器服务平台支持使用按量计费(Spot)资源创建集群,利用平台闲置算力,适用于容错能力强、能容忍中断的场景。
节点信息可用性与挂载
- 09-23:支持通过 Downward API(downwardAPI volume)在 Pod 内获取
spec.nodeName
,便于在容器内识别节点信息(直接通过fieldRef: spec.nodeName
仍不可用)。如需资源标识,可使用平台注解metadata.annotations['scheduling.infini-ai.com/quota-name']
。 - 09-03:支持在同可用区内以 hostpath 方式挂载高性能共享文件存储至集群。