模型介绍

DeepSeek-R1-Distill-Qwen-32B 是基于 DeepSeek-R1 蒸馏而来的模型,在 Qwen2.5-32B 的基础上使用 DeepSeek-R1 生成的样本进行微调。该模型在各种基准测试中表现出色,保持了强大的推理能力。

模型亮点
DeepSeek-R1-Distill-Qwen-32B 在多个基准测试中超越了 OpenAI-o1-mini,在密集模型领域实现了新的最先进结果。
  • 类型:蒸馏语言模型
  • 基础模型:Qwen2.5-32B
  • 参数规模:328亿
  • 张量类型:BF16
  • 推荐温度参数:0.5-0.7

注意

此模型的使用受许可协议约束,请查看以下许可部分。

评测数据

详见 官方数据

许可协议

https://huggingface.co/Qwen/Qwen2.5-32B/blob/main/LICENSE

免责声明

如果未使用适当的温度设置,模型可能会出现无限重复或输出不连贯的问题。使用者需自行承担使用风险。