无问芯穹文档

模型介绍

自 2025 年 10 月 31 日起，当您在 LLM API 请求中指定 deepseek-v3.1 时，实际使用的将是 deepseek-v3.1-terminus 模型。

DeepSeek-V3.1-Terminus 在保持模型原有能力的同时，解决了用户报告的一些问题，包括：

语言一致性：减少中英文混杂文本和偶尔出现的异常字符；
代理能力：进一步优化代码代理和搜索代理的性能。

模型亮点

DeepSeek-V3.1 系列混合模型支持思考模式和非思考模式。该模型在 DeepSeek-V3.1-Base 的基础上进行后训练，通过两阶段长上下文扩展方法构建，显著扩展了数据集规模。DeepSeek-V3.1 相比前一版本在多个方面带来了改进：支持混合思考模式，一个模型通过改变聊天模板即可支持思考模式和非思考模式；通过后训练优化，模型在工具使用和智能体任务方面的性能显著提升；DeepSeek-V3.1-Think 实现了与 DeepSeek-R1-0528 相当的答案质量，同时响应更快。模型使用 UE8M0 FP8 缩放数据格式训练，确保与微缩放数据格式的兼容性。

该模型在通过 OpenAI 兼容接口调用时，可通过 enable_thinking 布尔参数控制推理（Reasoning）能力开关，默认关闭。

产品简介

访问 AICoder

传输文件

账号与权限

凭证管理

费用中心

通知中心

算力资源池管理

高性能存储管理

镜像中心

开发机

训练任务

推理部署

存储服务

企业服务

极值算力

AI 容器服务平台

预置模型

大语言模型 API

向量嵌入与重排序

计费与支持

ComfyUI 工作流托管

API 调用

监控与计费

产品简介

使用指南

模型介绍

模型亮点

模型介绍 ​

模型亮点 ​

模型介绍

模型亮点