发布预告:以下模型将下架,请提前完成迁移或替换:
baichuan-m2-32bjina-embeddings-v2-base-codejina-embeddings-v2-base-zh
Release notes
发布预告:以下模型将下架,请提前完成迁移或替换:
baichuan-m2-32bjina-embeddings-v2-base-codejina-embeddings-v2-base-zh大语言模型 API 新增被动缓存(cache)功能,输入中被缓存命中的部分按优惠价格计费。
「费用中心」新增预算管理功能。支持按用户设置每周、每月预算额度,查看预算消耗情况。支持限制全部产品或指定产品。
上线 Mimo V2.5 Pro。可在体验中心试用,支持 API 调用。
mimo-v2.5-pro上线 Kimi K2.6。可在体验中心试用,支持通用 LLM API 调用。
kimi-k2.6以下模型下架,请提前完成迁移或替换:
deepseek-ocrernie-4.5-21b-a3bernie-4.5-300b-a47bkimi-k2-instructminimax-m2qwq-32bInfini 编码套餐新增支持 glm-5.1。
上线 GLM-5.1。可在体验中心试用,支持 API 调用。
「邀请请好友立享」活动结束。
调整用量统计页面的数据更新时效:用量统计页面中的数据通常会在您实际发起 API 调用后约 10 分钟更新。
调整用量统计数据的更新时效:与 Coding Plan 相关 API Key 的用量统计数据通常会在您实际发起 API 调用后约 10 分钟更新。
「首次首月购买5折」优惠活动结束。
停止提供基础版 LLM API 免费服务(网页端持续免费),请关注账户余额,及时充值。
上线 Minimax 系列大语言模型。可在体验中心试用,支持 API 调用。
minimax-m2.7Infini 编码套餐支持范围扩充,新增以下模型:
minimax-m2.7Infini 编码套餐支持将 Lite 套餐升级 Pro 套餐。
「首次首月购买5折」优惠。Lite 版本折后首月 19.9 月,Pro 版本折后首月 99.9 元。
「邀请请好友立享」:每成功邀请一位好友完成注册,获得 CodingPlan 通用代金券 5元 。「受邀好友立享」:受邀好友完成新用户注册后,也将获得 CodingPlan Lite 5元代金券 (有效期 7天)、CodingPlan Pro 25元代金券 (有效期 7天)。
变更 7 天配额与 30 天配额重置机制,不再使用滑动窗口动态刷新。
00:00:00 重置。00:00:00 重置。Infini 编码套餐页面新增手动续费选项。
Infini 编码套餐页面新增套餐的额度与实时用量情况(1-2分钟级别延时)。页面分别展示 5 小时、最近 7 天、最近 30 天的用量与额度。
Infini 编码套餐新增专属 API 接口,用于监控和查询 Infini 编码套餐用量。API 响应中包含 5 小时、最近 7 天、最近 30 天的额度、已使用量和剩余额度。
Infini 编码套餐 Anthropic 协议支持范围扩充至以下模型:
deepseek-v3.2deepseek-v3.2-thinkingkimi-k2.5minimax-m2.1minimax-m2.5glm-4.7glm-5上线智谱系列大语言模型。可在体验中心试用,支持 API 调用。
glm5下架 OpenAI GPT OSS 系列模型。
gpt-oss-20bInfini 编码套餐(Coding Plan)是面向开发者的 AI 编程订阅服务。通过一份订阅,您即可在熟悉的开发工具中同时使用 DeepSeek、MiniMax、Kimi (Moonshot)、GLM (Zhipu) 等多家顶尖厂商的主流编程模型,灵活应对不同复杂度的开发需求。
上线 Kimi 系列大语言模型。可在体验中心试用,支持 API 调用。
kimi-k2.5上线 Minimax 系列大语言模型。可在体验中心试用,支持 API 调用。
minimax-m2.1上线智谱系列大语言模型。可在体验中心试用,支持 API 调用。
glm4.7智能体服务平台正式上线。智能体服务平台(Agent Service Platform)是基于下一代 Agentic Infra 范式构建的智能体服务平台。平台不仅仅提供智能体(Agent)托管,更致力于为智能体构建完整的体验——赋予其大脑(SOTA 模型调度)、双手(MCP 工具链与环境)和记忆(上下文管理),帮助企业和开发者跨越技术门槛,构建具备自主决策能力的顶尖应用。
上线智谱系列大语言模型。可在体验中心试用,支持 API 调用。
glm4.6v上线 DeepSeek 系列大语言模型。可在体验中心试用,支持 API 调用。注意,以下单独的模型 ID 能力相同,仅默认行为不同。
deepseek-v3.2(默认非思考模式)deepseek-v3.2-thinking(默认开启思考模式)支持 Anthropic 兼容的 Messages 接口。暂仅支持部分模型。
glm-4.6glm-4.5minimax-m2最新支持情况请访问智算云平台 GenStudio 模型广场,以「Claude 兼容」筛选结果为准。
下架阶跃星辰 Step 系列大语言模型。
step3上线 DeepSeek-OCR 模型。支持 API 调用。
deepseek-ocr参数调试页支持「刷新参数」。在参数表单未包含最新参数时,可拉取最新枚举值(如模型列表、采样器等),最长约 5 分钟完成。
原生 ComfyUI 编辑器可自动获取最新枚举值(如模型列表、采样器等)。
调整原生 ComfyUI 编辑器入口为工作流详情页的标签页,ComfyUI 编辑器支持全屏展示。
调用记录新增「任务来源:系统任务」,可区分由平台发起的维护性任务。系统任务不计费,且不占用租户购买的包并发槽位。
上线 DeepSeek 和 GLM 系列大语言模型。可在体验中心试用,支持 API 调用。
deepseek-v3.2-expglm-4.6上线 Qwen3-VL 系列大语言模型。可在体验中心试用,支持 API 调用。
qwen3-vl-235b-a22b-instructqwen3-vl-235b-a22b-thinking上线 DeepSeek 系列大语言模型。可在体验中心试用,支持 API 调用。
deepseek-v3.1-terminus上线 Qwen Next 系列大语言模型。可在体验中心试用,支持 API 调用。
qwen3-next-80b-a3b-instructqwen3-next-80b-a3b-thinking部分模型支持通过 enable_thinking 参数开启、关闭推理能力。例如:
deepseek-v3.1qwen3-8bqwen3-32bqwen3-30b-a3bqwen3-235b-a22bglm-4.5glm-4.5-airglm-4.5vKimi K2 Instruct 模型更新为 0905 版本。体验中心及 API 服务中的 kimi-k2-instruct 模型已替换至 Kimi K2 0905 版本,模型 ID 保持不变。Kimi K2 0905 版本模型具备更强的智能体编程能力、改进的前端编程体验以及扩展至 256K 的上下文长度。
kimi-k2-instruct上架智谱 GLM 系列模型。可在体验中心试用,支持 API 调用。
glm-4.5v上架 OpenAI GPT OSS 系列模型。通过企业认证后,可在体验中心试用,支持 API 调用。
gpt-oss-120bgpt-oss-20b下架 LLaMA 系列大语言模型。
llama-2-7b-chatllama-3.3-70b-instructllama-3-infini-8b-instruct上架阶跃星辰 AI 大语言模型,可在体验中心试用,支持 API 调用。
step3上架 Qwen3 Coder 系列大语言模型。可在体验中心试用,支持 API 调用。
qwen3-coder-480b-a35b-instructComfyUI 工作流平台模型管理功能重大更新,全面提升您在生产环境中管理模型资产的效率与安全性。本次升级后,您现可从公网 URL 或本地一次性导入整个模型文件夹。为了便于管理,界面已升级为全新的"路径树+模型列表"视图,让您能根据目录结构直观地浏览资产。同时,我们引入了"可用范围"这一核心安全机制,通过限制模型的使用环境来保障平台的稳定与租户隔离。
下架部分大语言模型。
qwen1.5-14b-chat权限系统全面更新。支持完善的授权操作(Authorization),将策略授予用户或用户组,可指定资源范围(如"我的"、"指定资源池"、"指定资源"、"全部")。为兼容新版权限系统,可能会自动调整现有用户组授权并新增自定义策略。历史数据迁移仅保证最终效果一致,具体配置方式可能无法完美匹配您的管理需求。建议在迁移完成后,根据组织架构与资源规划自行调整。如需帮助,请联系售后。
ComfyUI 调用记录留存天数改为 15 天。
ComfyUI 调用记录筛选条件支持手动输入任务 ID,多个任务 ID 须以英文逗号分隔。
下架 DeepSeek 系列旧版大语言模型。
deepseek-r1-0120