无问芯穹文档

模型介绍

Qwen3-8B 是 Qwen 系列第三代的大型语言模型，拥有 82 亿参数，专为高效推理和多语言任务设计。支持无缝切换思考模式（复杂推理）和非思考模式（通用对话），在数学、编码、常识推理及多语言指令执行中表现出色。

模型亮点

Qwen3-8B 提供以下关键特性：

灵活模式切换：支持思考模式（逻辑推理、数学、编码）和非思考模式（高效对话），适配多种场景。
强大推理能力：在数学、代码生成和常识推理方面超越 QwQ 和 Qwen2.5 模型。
人类偏好对齐：在创意写作、角色扮演及多轮对话中提供自然且沉浸式体验。
代理能力：与外部工具集成，表现出色，适合复杂代理任务。
多语言支持：支持 100 多种语言和方言，具备强大的翻译和指令执行能力。
模型规格：因果语言模型，82 亿参数，69.5 亿非嵌入参数，36 层，GQA 注意力（Q: 32, KV: 8）。

支持通过 enable_thinking 参数控制是否开启推理能力，默认关闭。

注意：此模型的使用受许可协议的约束。请在下方查看相关的协议内容。

评测数据

详见官方数据

许可协议

https://choosealicense.com/licenses/apache-2.0/

免责声明

限于技术特性，平台在尽到合理努力的前提下，仍无法完全保证您通过本服务获得的输出的合法性、真实性、准确性以及完整性。您应对本服务中的输出自行加以判断，并承担因使用内容引起的所有风险。平台不对前述风险导致的损失或损害承担责任。本服务下的输出不代表专业意见，不能代替法律、医疗、金融等专业领域从业人员的解答。相关观点仅限于算法触达的数据呈现的参考结果，不代表平台立场。由于机器学习特性，相同输入可能产生不同输出，请注意甄别。

产品简介

访问 AICoder

传输文件

账号与权限

凭证管理

费用中心

通知中心

算力资源池管理

高性能存储管理

镜像中心

开发机

训练任务

推理部署

存储服务

企业服务

镜像中心

极值算力

AI 容器服务平台

预置模型

大语言模型 API

向量嵌入与重排序

定制模型服务

微调服务

计费与支持

ComfyUI 工作流托管

API 调用

监控与计费

模型介绍

模型亮点

评测数据

许可协议

免责声明

模型介绍 ​

模型亮点 ​

评测数据 ​

许可协议 ​

免责声明 ​

模型介绍

模型亮点

评测数据

许可协议

免责声明