模型介绍
Qwen3-30B-A3B 是 Qwen 系列第三代的大型语言模型,采用混合专家(MoE)架构,总计 305 亿参数,每 token 激活 33 亿参数。支持无缝切换思维模式(复杂推理)和非思维模式(通用对话),在数学、编码、常识推理及多语言指令执行中表现出色。
模型亮点
Qwen3-30B-A3B 提供以下关键特性:
- 灵活模式切换:支持思维模式(逻辑推理、数学、编程)和非思维模式(高效对话),适配多种场景。
- 强大推理能力:在数学、代码生成和常识推理方面超越 QwQ 和 Qwen2.5 模型。
- 人类偏好对齐:在创意写作、角色扮演及多轮对话中提供自然且沉浸式体验。
- 代理能力:与外部工具集成,表现出色,适合复杂代理任务。
- 多语言支持:支持 100 多种语言和方言,具备强大的翻译和指令执行能力。
- 模型规格:因果语言模型,305 亿参数(激活 33 亿),299 亿非嵌入参数,48 层,GQA 注意力(Q: 32, KV: 4),128 个专家(激活 8 个)。
该模型在通过 OpenAI 兼容接口调用时,可通过 enable_thinking 布尔参数控制推理(Reasoning)能力开关,默认关闭。
注意: 此模型的使用受许可协议的约束。
免责声明
限于技术特性,平台在尽到合理努力的前提下,仍无法完全保证您通过本服务获得的输出的合法性、真实性、准确性以及完整性。您应对本服务中的输出自行加以判断,并承担因使用内容引起的所有风险。平台不对前述风险导致的损失或损害承担责任。本服务下的输出不代表专业意见,不能代替法律、医疗、金融等专业领域从业人员的解答。相关观点仅限于算法触达的数据呈现的参考结果,不代表平台立场。由于机器学习特性,相同输入可能产生不同输出,请注意甄别。