模型介绍

Qwen2.5-Coder 是最新的代码专用 Qwen 大型语言模型系列。Qwen2.5-Coder 在 CodeQwen1.5 的基础上带来了以下改进:

  • 显著提升代码生成、代码推理和代码修复能力。
  • 支持真实世界应用,例如代码代理,增强编码能力和数学及一般能力。
  • 支持长上下文处理。
模型亮点

Qwen2.5-Coder-7B-Instruct 模型特点如下:

  • 类型:因果语言模型
  • 训练阶段:预训练与后训练
  • 架构:带有 RoPE、SwiGLU、RMSNorm 和 Attention QKV 偏置的 transformers
  • 参数数量:76.1 亿
  • 非嵌入参数数量:65.3 亿
  • 层数:28
  • 注意力头数 (GQA):Q 为 28,KV 为 4

NOTE

此模型的使用受许可协议的约束。请在下方查看相关的协议内容。

评测数据
当前模型
qwen2.5-coder-7b-instruct
humaneval
88.4
mbpp
83.5
evalplus
81.9
multipl-e
76.5
mceval
60.3
livecodebench
35.9
cruxeval
65.9
bigcodebench
29.6
aider
57.1
spider
82.0
bird-sql
51.1
codearena
43.1
fill-in-the-middle
gsm8k
math
mmlu
arc-challenge
同系列模型
qwen2.5-coder-14b
qwen2.5-coder-32b-instruct
qwen2.5-coder-7b
humaneval
64.0
92.7
61.6
mbpp
71.4
90.2
68.8
evalplus
86.3
multipl-e
59.9
79.4
57.5
mceval
65.9
livecodebench
31.4
cruxeval
66.4
83.4
56.0
bigcodebench
37.0
38.3
31.0
aider
73.7
spider
85.1
bird-sql
58.4
codearena
68.9
fill-in-the-middle
87.7
86.2
gsm8k
88.7
83.9
math
52.8
46.6
mmlu
75.2
68.0
arc-challenge
66.0
60.9

NOTE

详见 官方数据

许可协议

https://github.com/QwenLM/Qwen2.5?tab=readme-ov-file#license-agreement

免责声明

限于技术特性,平台在尽到合理努力的前提下,仍无法完全保证您通过本服务获得的输出的合法性、真实性、准确性以及完整性。您应对本服务中的输出自行加以判断,并承担因使用内容引起的所有风险。 我们提示您,除法律有明确规定外,平台无法也不会对前述风险而导致的任何损失或损害承担责任。本服务下的输出不代表专业意见,不能代替如法律、医疗、金融等专业领域从业人员向您解答对应疑问。相关观点也仅限于算法所触达有限数据呈现的供您参考的结果,并不代表平台立场。 由于机器学习特性,就相同的输入可能产生不同的输出结果,请您注意甄别。