DeepSeek-R1-Distill-Qwen-32B 是基于 DeepSeek-R1 蒸馏而来的模型,在 Qwen2.5-32B 的基础上使用 DeepSeek-R1 生成的样本进行微调。该模型在各种基准测试中表现出色,保持了强大的推理能力。
注意
此模型的使用受许可协议约束,请查看以下许可部分。
详见 官方数据
https://huggingface.co/Qwen/Qwen2.5-32B/blob/main/LICENSE
如果未使用适当的温度设置,模型可能会出现无限重复或输出不连贯的问题。使用者需自行承担使用风险。