Release notes

更新日志

显示 76 / 155 条截至 2026-07-09默认窗口：2025-07-09 起，含发布预告

产品服务年份

2026-06-30

GenStudio删除

以下模型已下架：

deepseek-r1-distill-qwen-32b
deepseek-v3.2-exp
qwen3-vl-235b-a22b-thinking
qwen3-vl-235b-a22b-instruct
qwen3-next-80b-a3b-thinking
qwen3-next-80b-a3b-instruct
qwen3-coder-480b-a35b-instruct
qwen3-235b-a22b-instruct-2507
qwen3-235b-a22b
qwen3-8b
qwen3-14b
qwen3-32b
qwen3-30b-a3b
kimi-k2-thinking

如果您的业务此前使用这些模型，可以按业务场景优先评估以下替换方向，帮助完成迁移：

如果当前使用上述 Qwen3 系列模型，建议优先评估 qwen3.6。
如果当前使用 deepseek-r1-distill-qwen-32b 或 deepseek-v3.2-exp，建议优先评估 deepseek-v4-flash 或 deepseek-v4-pro。
如果当前使用 kimi-k2-thinking，建议优先评估 kimi-k2.6。

2026-06-26

Infini 编码套餐删除

Infini 编码套餐（Coding Plan）已于 2026-06-26 下线并停止服务。

2026-06-19

GenStudio删除

以下模型已于 2026 年 6 月 19 日下架：

baichuan-m2-32b
jina-embeddings-v2-base-code
jina-embeddings-v2-base-zh

2026-06-18

GenStudio新增

上线 Qwen3.6 系列模型。可在体验中心试用，支持 API 调用。

qwen3.6-27b
qwen3.6-35b-a3b

2026-06-17

GenStudio新增

上线 GLM-5.2。可在体验中心试用，支持 API 调用。

glm-5.2

2026-06-16

Comfy 工作流托管平台新增

以下产品支持预算管理：

ComfyUI 工作流调用

Comfy 工作流托管平台新增

ComfyUI API 新增错误码 10024，表示当前账号消费已超过预算金额上限。遇到该错误时，请调整预算上限，或联系管理员处理预算限制。

GenStudio新增

GenStudio API 新增错误码 10024，表示当前账号消费已超过预算金额上限。遇到该错误时，请调整预算上限，或联系管理员处理预算限制。详情请参见 GenStudio LLM API 错误码、图片和视频生成 API 错误码。

GenStudio新增

以下产品支持预算管理：

预置服务按量在线调用
视频大模型调用
批量推理

2026-05-31

GenStudio新增

大语言模型 API 新增被动缓存（cache）功能，输入中被缓存命中的部分按优惠价格计费。

于 2026 年 6 月 1 日 00:00 起生效。
暂仅支持部分模型。已支持被动缓存的模型及缓存命中后的计费价格，请前往平台服务列表页面查看。
仅适用于采用按量计费的客户。如合同已约定具体价格或优惠，则以合同约定价为准。

2026-05-28

基础能力变更

「费用中心」新增预算管理功能。支持按用户设置每周、每月预算额度，查看预算消耗情况。支持限制全部产品或指定产品。

2026-05-07

基础能力变更

「费用中心」个人认证租户的「个人抬头」改为必须人工填写。填写发票抬头时，提示「请输入与个人认证一致的姓名」。

GenStudio删除

下线 Qwen2.5 系列模型。请将相关调用迁移或替换为其他可用模型：

qwen2.5-7b-instruct
qwen2.5-14b-instruct
qwen2.5-32b-instruct
qwen2.5-72b-instruct
qwen2.5-vl-7b-instruct
qwen2.5-vl-32b-instruct
qwen2.5-vl-72b-instruct
qwen2.5-coder-32b-instruct

2026-04-28

GenStudio新增

上线 Mimo V2.5 Pro。可在体验中心试用，支持 API 调用。

mimo-v2.5-pro

2026-04-22

GenStudio新增

上架 DeepSeek-V4 系列模型。可在体验中心试用，支持 API 调用。

deepseek-v4-pro
deepseek-v4-flash

GenStudio新增

上线 Mimo V2 Pro。可在体验中心试用，支持 API 调用。

mimo-v2-pro

2026-04-21

GenStudio新增

上线 Kimi K2.6。可在体验中心试用，支持通用 LLM API 调用。

kimi-k2.6

2026-04-10

GenStudio删除

以下模型下架，请提前完成迁移或替换：

deepseek-ocr
ernie-4.5-21b-a3b
ernie-4.5-300b-a47b
kimi-k2-instruct
minimax-m2
qwq-32b

2026-04-09

Infini 编码套餐新增

Infini 编码套餐新增支持 glm-5.1。

2026-04-08

GenStudio新增

上线 GLM-5.1。可在体验中心试用，支持 API 调用。

2026-04-07

Infini 编码套餐删除

「邀请请好友立享」活动结束。

2026-04-02

GenStudio变更

调整用量统计页面的数据更新时效：用量统计页面中的数据通常会在您实际发起 API 调用后约 10 分钟更新。

Infini 编码套餐变更

调整用量统计数据的更新时效：与 Coding Plan 相关 API Key 的用量统计数据通常会在您实际发起 API 调用后约 10 分钟更新。

2026-03-31

Infini 编码套餐删除

「首次首月购买5折」优惠活动结束。

2026-03-30

GenStudio变更

停止提供基础版 LLM API 免费服务（网页端持续免费），请关注账户余额，及时充值。

2026-03-18

GenStudio新增

上线 Minimax 系列大语言模型。可在体验中心试用，支持 API 调用。

minimax-m2.7

Infini 编码套餐新增

Infini 编码套餐支持范围扩充，新增以下模型：

minimax-m2.7

2026-03-13

Infini 编码套餐新增

Infini 编码套餐支持将 Lite 套餐升级 Pro 套餐。

Infini 编码套餐新增

「首次首月购买5折」优惠。Lite 版本折后首月 19.9 月，Pro 版本折后首月 99.9 元。

Infini 编码套餐新增

「邀请请好友立享」：每成功邀请一位好友完成注册，获得 CodingPlan 通用代金券 5元。「受邀好友立享」：受邀好友完成新用户注册后，也将获得 CodingPlan Lite 5元代金券 (有效期 7天)、CodingPlan Pro 25元代金券 (有效期 7天)。

Infini 编码套餐变更

变更 7 天配额与 30 天配额重置机制，不再使用滑动窗口动态刷新。

7 天配额（周配额）：系统连续统计累计 7 天内的请求总数，每周一 00:00:00 重置。
30 天配额（月配额）：系统连续统计累计 30 天内的请求总数，每订阅周期第一日 00:00:00 重置。

2026-03-05

Infini 编码套餐新增

Infini 编码套餐页面新增手动续费选项。

Infini 编码套餐新增

Infini 编码套餐页面新增套餐的额度与实时用量情况（1-2分钟级别延时）。页面分别展示 5 小时、最近 7 天、最近 30 天的用量与额度。

Infini 编码套餐新增

Infini 编码套餐新增专属 API 接口，用于监控和查询 Infini 编码套餐用量。API 响应中包含 5 小时、最近 7 天、最近 30 天的额度、已使用量和剩余额度。

Infini 编码套餐变更

Infini 编码套餐 Anthropic 协议支持范围扩充至以下模型：

deepseek-v3.2
deepseek-v3.2-thinking
kimi-k2.5
minimax-m2.1
minimax-m2.5
glm-4.7
glm-5

2026-02-13

基础能力新增

费用中心账单页面的「明细账单」新增「用户名称/ID」字段。租户可通过该字段筛选各个用户的明细账单，追踪用户的平台消费记录。线下创建的账单，「用户名称/ID」字段展示为 -。

GenStudio新增

上线 Minimax 系列大语言模型。可在体验中心试用，支持 API 调用。

minimax-m2.5

2026-02-12

GenStudio新增

上线智谱系列大语言模型。可在体验中心试用，支持 API 调用。

glm5

2026-02-11

GenStudio删除

下架 OpenAI GPT OSS 系列模型。

gpt-oss-20b

Infini 编码套餐新增

Infini 编码套餐（Coding Plan）是面向开发者的 AI 编程订阅服务。通过一份订阅，您即可在熟悉的开发工具中同时使用 DeepSeek、MiniMax、Kimi (Moonshot)、GLM (Zhipu) 等多家顶尖厂商的主流编程模型，灵活应对不同复杂度的开发需求。

2026-02-02

基础能力新增

支持线上自助开具发票。2026 年 2 月（含）之后的消费账单可线上自助开具发票。注意：

2026 年 2 月的消费月账单在 2026 年 3 月 2 日生成。因此，最早可线上开具自助开具发票的日期为 2026 年 3 月 2 日。
2026 年 1 月（含）之前的消费仍需人工开具发票。
基于消费生成订单或账单后方，可申请开具发票，充值未消费的金额不可线上申请发票。
可开票总额最大不超过充值总金额。

基础能力新增

新增「AI 助手」，提供基于文档的问答能力。

2026-01-29

GenStudio新增

上线 Kimi 系列大语言模型。可在体验中心试用，支持 API 调用。

kimi-k2.5

2026-01-17

GenStudio变更

用量统计页面升级：

大语言模型统计指标全面升级：新增性能指标（如 TTFT、OTPS、RPM、TPM）与详细错误统计，支持从调用量、性能、错误三个维度深度分析服务状况。
全局新增数据导出功能，支持下载 Excel 报表。

GenStudio变更

模型详情页更新：新增「调用详情」页签，支持查看单模型的详细调用数据、性能指标和错误统计。

2025-12-24

GenStudio新增

上线 Minimax 系列大语言模型。可在体验中心试用，支持 API 调用。

minimax-m2.1

2025-12-23

GenStudio新增

上线智谱系列大语言模型。可在体验中心试用，支持 API 调用。

glm4.7

2025-12-15

智能体服务平台新增

智能体服务平台正式上线。智能体服务平台（Agent Service Platform）是基于下一代 Agentic Infra 范式构建的智能体服务平台。平台不仅仅提供智能体（Agent）托管，更致力于为智能体构建完整的体验——赋予其大脑（SOTA 模型调度）、双手（MCP 工具链与环境）和记忆（上下文管理），帮助企业和开发者跨越技术门槛，构建具备自主决策能力的顶尖应用。

2025-12-10

GenStudio新增

上线智谱系列大语言模型。可在体验中心试用，支持 API 调用。

glm4.6v

2025-12-02

GenStudio新增

上线 DeepSeek 系列大语言模型。可在体验中心试用，支持 API 调用。注意，以下单独的模型 ID 能力相同，仅默认行为不同。

deepseek-v3.2（默认非思考模式）
deepseek-v3.2-thinking（默认开启思考模式）

2025-11-21

GenStudio新增

支持 Anthropic 兼容的 Messages 接口。暂仅支持部分模型。

glm-4.6
glm-4.5
minimax-m2

最新支持情况请访问智算云平台 GenStudio 模型广场，以「Claude 兼容」筛选结果为准。

2025-11-20

GenStudio删除

下架阶跃星辰 Step 系列大语言模型。

step3

2025-11-06

GenStudio新增

上线 DeepSeek-OCR 模型。支持 API 调用。

deepseek-ocr

2025-10-21

Comfy 工作流托管平台新增

参数调试页支持「刷新参数」。在参数表单未包含最新参数时，可拉取最新枚举值（如模型列表、采样器等），最长约 5 分钟完成。

Comfy 工作流托管平台新增

原生 ComfyUI 编辑器可自动获取最新枚举值（如模型列表、采样器等）。

Comfy 工作流托管平台变更

调整原生 ComfyUI 编辑器入口为工作流详情页的标签页，ComfyUI 编辑器支持全屏展示。

Comfy 工作流托管平台变更

调用记录新增「任务来源：系统任务」，可区分由平台发起的维护性任务。系统任务不计费，且不占用租户购买的包并发槽位。

2025-09-30

GenStudio新增

上线 DeepSeek 和 GLM 系列大语言模型。可在体验中心试用，支持 API 调用。

deepseek-v3.2-exp
glm-4.6

2025-09-28

GenStudio新增

上线 Qwen3-VL 系列大语言模型。可在体验中心试用，支持 API 调用。

qwen3-vl-235b-a22b-instruct
qwen3-vl-235b-a22b-thinking

2025-09-20

GenStudio新增

上线 DeepSeek 系列大语言模型。可在体验中心试用，支持 API 调用。

deepseek-v3.1-terminus

2025-09-12

GenStudio新增

上线 Qwen Next 系列大语言模型。可在体验中心试用，支持 API 调用。

qwen3-next-80b-a3b-instruct
qwen3-next-80b-a3b-thinking

2025-09-08

GenStudio变更

部分模型支持通过 enable_thinking 参数开启、关闭推理能力。例如：

deepseek-v3.1
qwen3-8b
qwen3-32b
qwen3-30b-a3b
qwen3-235b-a22b
glm-4.5
glm-4.5-air
glm-4.5v

2025-09-05

GenStudio变更

Kimi K2 Instruct 模型更新为 0905 版本。体验中心及 API 服务中的 kimi-k2-instruct 模型已替换至 Kimi K2 0905 版本，模型 ID 保持不变。Kimi K2 0905 版本模型具备更强的智能体编程能力、改进的前端编程体验以及扩展至 256K 的上下文长度。

kimi-k2-instruct

2025-08-26

GenStudio新增

上线 DeepSeek-V3.1。

deepseek-v3.1

GenStudio删除

下架 DeepSeek R1 蒸馏模型。

deepseek-r1-0528-qwen3-8b

2025-08-12

GenStudio新增

上架智谱 GLM 系列模型。可在体验中心试用，支持 API 调用。

glm-4.5v

2025-08-10

GenStudio变更

deepseek-r1 支持更大的 128K 上下文窗口（原64K）；最大生成长度扩展至 32K（含思维链）。支持函数调用。

GenStudio变更

deepseek-v3 支持更大的 128K 上下文窗口（原64K）；最大生成长度 16K。支持函数调用。

2025-08-06

GenStudio新增

上架 OpenAI GPT OSS 系列模型。通过企业认证后，可在体验中心试用，支持 API 调用。

gpt-oss-120b
gpt-oss-20b

2025-08-04

GenStudio删除

下架 LLaMA 系列大语言模型。

llama-2-7b-chat
llama-3.3-70b-instruct
llama-3-infini-8b-instruct

2025-07-31

GenStudio新增

上架阶跃星辰 AI 大语言模型，可在体验中心试用，支持 API 调用。

step3

2025-07-28

GenStudio新增

上架智谱 AI 大语言模型，可在体验中心试用，支持 API 调用。

glm-4.5
glm-4.5-air

GenStudio删除

下架部分大语言模型。

qwen2-7b-chat

2025-07-24

GenStudio新增

上架 Qwen3 Coder 系列大语言模型。可在体验中心试用，支持 API 调用。

qwen3-coder-480b-a35b-instruct

2025-07-14

Comfy 工作流托管平台新增

ComfyUI 工作流平台模型管理功能重大更新，全面提升您在生产环境中管理模型资产的效率与安全性。本次升级后，您现可从公网 URL 或本地一次性导入整个模型文件夹。为了便于管理，界面已升级为全新的"路径树+模型列表"视图，让您能根据目录结构直观地浏览资产。同时，我们引入了"可用范围"这一核心安全机制，通过限制模型的使用环境来保障平台的稳定与租户隔离。

2025-07-09

GenStudio删除

下架部分大语言模型。

qwen1.5-14b-chat