GenStudio LLM API 部分模型价格调整公告GenStudio LLM API 部分模型价格调整公告 ,新价格 2025 年 11 月 1 日生效查看详情
Skip to content

2025年秋季(9–10月)重要功能更新回顾 ☀️

2025-10-17

2025 年 9–10 月期间,我们围绕大模型服务平台(GenStudio)、一站式 AI 平台(AIStudio)与 AI 容器服务平台(KubeStudio)进行了多项升级。本篇按主题梳理自 9 月 1 日以来的关键更新,帮助您快速把握秋季(9–10 月)能力变化。

模型矩阵与 API 能力升级(GenStudio)

大模型服务平台提供了新模型矩阵 + enable_thinking 开关,更丰富的选择与可控性,便于实验评估与线上业务迁移。

新增模型与版本

  • 09-30:上线 DeepSeek 与 GLM 系列模型,支持体验中心与 API 调用。
    • deepseek-v3.2-exp
    • glm-4.6
  • 09-28:上线 Qwen3-VL 多模态模型。
    • qwen3-vl-235b-a22b-instruct
    • qwen3-vl-235b-a22b-thinking
  • 09-20:上线 DeepSeek 系列模型。
    • deepseek-v3.1-terminus
  • 09-12:上线 Qwen Next 系列模型。
    • qwen3-next-80b-a3b-instruct
    • qwen3-next-80b-a3b-thinking

推理可控性与版本更新

  • 09-08:部分模型支持通过 enable_thinking 参数开启/关闭推理能力。
    • 适用模型:deepseek-v3.1qwen3-8bqwen3-32bqwen3-30b-a3bqwen3-235b-a22bglm-4.5glm-4.5-airglm-4.5v
  • 09-05:kimi-k2-instruct 更新为 Kimi K2 0905 版本,模型 ID 保持不变,能力与上下文长度提升至 256K。

资源与存储管理(AIStudio)

一站式 AI 平台实现资源标签治理和云盘独立生命周期。

资源标签与云盘增强

  • 新增资源标签能力:以 KV 键值对(如 demo:llm)对「开发机」「任务」「推理服务」「镜像」进行分类聚合。
  • AIStudio 开发机改配时支持云盘扩容,并支持释放(删除)云盘;无需删除关联的弹性开发机即可单独删除云盘。

高性能共享文件存储

  • 支持线上自助购买高性能共享文件存储、创建文件系统、查看容量与 inode 使用情况,并支持自助删除存储卷与文件系统(当前暂仅支持广东 B 可用区)。

集群与调度能力与成本优化(KubeStudio)

AI 容器服务平台提供了 Spot 集群、高性能共享存储自助化 hostpath 挂载,帮助您高效使用资源。

按量(Spot)资源集群

  • AI 容器服务平台支持使用按量计费(Spot)资源创建集群,利用平台闲置算力,适用于容错能力强、能容忍中断的场景。

节点信息可用性与挂载

  • 09-23:支持通过 Downward API(downwardAPI volume)在 Pod 内获取 spec.nodeName,便于在容器内识别节点信息(直接通过 fieldRef: spec.nodeName 仍不可用)。如需资源标识,可使用平台注解 metadata.annotations['scheduling.infini-ai.com/quota-name']
  • 09-03:支持在同可用区内以 hostpath 方式挂载高性能共享文件存储至集群。

注意

本文汇总 2025-09-01 起至今的重要更新,更多细节请查阅以下更新日志: