模型介绍
DeepSeek R1 模型进行了一个小版本升级,当前版本为 DeepSeek-R1-0528。在最新更新中,DeepSeek R1 通过利用更多的计算资源并在后训练过程中引入算法优化机制,显著提高了其推理和推断能力的深度。该模型在各种基准测试中表现出色,包括数学、编程和一般逻辑方面。其整体性能现已接近领先模型,如 O3 和 Gemini 2.5 Pro。
模型亮点
与之前的版本相比,升级后的模型在处理复杂推理任务方面显示出显著改进。例如,在 AIME 2025 测试中,模型的准确率从之前的 70% 提高到了当前版本的 87.5%。这一进步源于推理过程中思考深度的增强:在 AIME 测试集中,之前的模型每题平均使用了 12K 个 token,而新版本平均每题使用了 23K 个 token。除了改进的推理能力外,这个版本还提供了更低的幻觉率、增强了对函数调用的支持,并改善了 vibe 编码的体验。

注意

使用建议:1. 为获得预期性能,使用 DeepSeek-R1 系列模型(包括基准测试)时,建议将 temperature 参数设置在 0.5-0.7 之间(推荐 0.6),以防止无限重复或输出不连贯。2. 避免添加系统提示词 (system prompt),所有指令应包含在用户提示词 (user prompt) 中。3. 对于数学问题,建议在提示词中包含类似这样的指令:'请逐步推理,并将最终答案放在\boxed{}中。' 4. 评估模型性能时,建议进行多次测试并取平均值。

评测数据

详见 官方数据

许可协议

https://github.com/deepseek-ai/DeepSeek-R1/blob/main/LICENSE

免责声明

由于 AI 技术的特性,我们无法完全确保通过本服务获得的输出的合法性、真实性、准确性或完整性。请自行判断输出结果,并承担使用内容产生的所有风险。输出不代表专业意见,不应替代法律、医疗或金融等领域专业人员的咨询。