无问芯穹文档

模型介绍

DeepSeek-R1-Distill-Qwen-32B 是基于 DeepSeek-R1 蒸馏而来的模型，在 Qwen2.5-32B 的基础上使用 DeepSeek-R1 生成的样本进行微调。该模型在各种基准测试中表现出色，保持了强大的推理能力。

模型亮点

DeepSeek-R1-Distill-Qwen-32B 在多个基准测试中超越了 OpenAI-o1-mini，在密集模型领域实现了新的最先进结果。

注意

此模型的使用受许可协议约束，请查看以下许可部分。

评测数据

许可协议

免责声明

如果未使用适当的温度设置，模型可能会出现无限重复或输出不连贯的问题。使用者需自行承担使用风险。