模型介绍
Qwen3-8B 是 Qwen 系列第三代的大型语言模型,拥有 82 亿参数,专为高效推理和多语言任务设计。支持无缝切换思考模式(复杂推理)和非思考模式(通用对话),在数学、编码、常识推理及多语言指令执行中表现出色。
模型亮点
Qwen3-8B 提供以下关键特性:
- 灵活模式切换:支持思考模式(逻辑推理、数学、编码)和非思考模式(高效对话),适配多种场景。
- 强大推理能力:在数学、代码生成和常识推理方面超越 QwQ 和 Qwen2.5 模型。
- 人类偏好对齐:在创意写作、角色扮演及多轮对话中提供自然且沉浸式体验。
- 代理能力:与外部工具集成,表现出色,适合复杂代理任务。
- 多语言支持:支持 100 多种语言和方言,具备强大的翻译和指令执行能力。
- 模型规格:因果语言模型,82 亿参数,69.5 亿非嵌入参数,36 层,GQA 注意力(Q: 32, KV: 8)。
支持通过 enable_thinking
参数控制是否开启推理能力,默认关闭。
注意: 此模型的使用受许可协议的约束。请在下方查看相关的协议内容。
评测数据
详见 官方数据
许可协议
https://choosealicense.com/licenses/apache-2.0/
免责声明
限于技术特性,平台在尽到合理努力的前提下,仍无法完全保证您通过本服务获得的输出的合法性、真实性、准确性以及完整性。您应对本服务中的输出自行加以判断,并承担因使用内容引起的所有风险。平台不对前述风险导致的损失或损害承担责任。本服务下的输出不代表专业意见,不能代替法律、医疗、金融等专业领域从业人员的解答。相关观点仅限于算法触达的数据呈现的参考结果,不代表平台立场。由于机器学习特性,相同输入可能产生不同输出,请注意甄别。