模型介绍

ChatGLM3-6b 是由智谱开发的 ChatGLM 系列最新一代的 60 亿参数规模的开源模型。相较于 ChatGLM 之前系列的模型,ChatGLM3 采用了更多样的训练数据,并原生支持工具调用(Function Call)、代码执行(Code Interpreter)和 Agent 任务等复杂场景。

模型亮点

ChatGLM3-6b-32k 在 ChatGLM3-6b 基础上进一步强化了对于长文本的理解能力。详见官方在 LongBench 评测集的测试结果。

评测数据
当前模型
chatglm3-6b-32k
gsm8k
72.3
math
25.7
bbh
66.1
mmlu
61.4
c-eval
69
cmmlu
67.5
mbpp
52.4
agieval
53.7
avarage_longbench
50.2
summary_longbench
26.2
single_doc_qa_longbench
45.8
multi_doc_qa_longbench
46.1
code_longbench
56.2
few_shot_longbench
61.2
synthetic_longbench
65
同系列模型
chatglm3-6b-base
chatglm3-6b
chatglm3
gsm8k
72.3
72.3
72.3
math
25.7
25.7
25.7
bbh
66.1
66.1
66.1
mmlu
61.4
61.4
61.4
c-eval
69
69
69
cmmlu
67.5
67.5
67.5
mbpp
52.4
52.4
52.4
agieval
53.7
53.7
53.7
avarage_longbench
50.2
summary_longbench
26.2
single_doc_qa_longbench
45.8
multi_doc_qa_longbench
46.1
code_longbench
56.2
few_shot_longbench
61.2
synthetic_longbench
65

NOTE

详见 官方数据

免责声明

限于技术特性,平台在尽到合理努力的前提下,仍无法完全保证您通过本服务获得的输出的合法性、真实性、准确性以及完整性。您应对本服务中的输出自行加以判断,并承担因使用内容引起的所有风险。 我们提示您,除法律有明确规定外,平台无法也不会对前述风险而导致的任何损失或损害承担责任。本服务下的输出不代表专业意见,不能代替如法律、医疗、金融等专业领域从业人员向您解答对应疑问。相关观点也仅限于算法所触达有限数据呈现的供您参考的结果,并不代表平台立场。 由于机器学习特性,就相同的输入可能产生不同的输出结果,请您注意甄别。