无问芯穹文档

模型介绍

DeepSeek R1 模型进行了一个小版本升级，当前版本为 DeepSeek-R1-0528。在最新更新中，DeepSeek R1 通过利用更多的计算资源并在后训练过程中引入算法优化机制，显著提高了其推理和推断能力的深度。该模型在各种基准测试中表现出色，包括数学、编程和一般逻辑方面。其整体性能现已接近领先模型，如 O3 和 Gemini 2.5 Pro。

模型亮点

与之前的版本相比，升级后的模型在处理复杂推理任务方面显示出显著改进。例如，在 AIME 2025 测试中，模型的准确率从之前的 70% 提高到了当前版本的 87.5%。这一进步源于推理过程中思考深度的增强：在 AIME 测试集中，之前的模型每题平均使用了 12K 个 token，而新版本平均每题使用了 23K 个 token。除了改进的推理能力外，这个版本还提供了更低的幻觉率、增强了对函数调用的支持，并改善了 vibe 编码的体验。

注意

使用建议：1. 为获得预期性能，使用 DeepSeek-R1 系列模型（包括基准测试）时，建议将 temperature 参数设置在 0.5-0.7 之间（推荐 0.6），以防止无限重复或输出不连贯。2. 避免添加系统提示词 (system prompt)，所有指令应包含在用户提示词 (user prompt) 中。3. 对于数学问题，建议在提示词中包含类似这样的指令：'请逐步推理，并将最终答案放在\boxed{}中。' 4. 评估模型性能时，建议进行多次测试并取平均值。

评测数据

详见官方数据

许可协议

https://github.com/deepseek-ai/DeepSeek-R1/blob/main/LICENSE

免责声明

由于 AI 技术的特性，我们无法完全确保通过本服务获得的输出的合法性、真实性、准确性或完整性。请自行判断输出结果，并承担使用内容产生的所有风险。输出不代表专业意见，不应替代法律、医疗或金融等领域专业人员的咨询。