GenStudio 推出 Infini 编码套餐(Coding Plan)GenStudio 推出 Infini 编码套餐(Coding Plan) ,接入多家顶尖厂商的主流编程模型了解更多
Skip to content

模型介绍

自 2025 年 10 月 31 日起,当您在 LLM API 请求中指定 deepseek-v3.1 时,实际使用的将是 deepseek-v3.1-terminus 模型。

DeepSeek-V3.1-Terminus 在保持模型原有能力的同时,解决了用户报告的一些问题,包括:

  • 语言一致性:减少中英文混杂文本和偶尔出现的异常字符;
  • 代理能力:进一步优化代码代理和搜索代理的性能。

模型亮点

DeepSeek-V3.1 系列混合模型支持思考模式和非思考模式。该模型在 DeepSeek-V3.1-Base 的基础上进行后训练,通过两阶段长上下文扩展方法构建,显著扩展了数据集规模。DeepSeek-V3.1 相比前一版本在多个方面带来了改进:支持混合思考模式,一个模型通过改变聊天模板即可支持思考模式和非思考模式;通过后训练优化,模型在工具使用和智能体任务方面的性能显著提升;DeepSeek-V3.1-Think 实现了与 DeepSeek-R1-0528 相当的答案质量,同时响应更快。模型使用 UE8M0 FP8 缩放数据格式训练,确保与微缩放数据格式的兼容性。

该模型在通过 OpenAI 兼容接口调用时,可通过 enable_thinking 布尔参数控制推理(Reasoning)能力开关,默认关闭。

找不到想要的答案?
让 AI 助手为您解答