GenStudio 于 2025 年 5 月 推出 GenStudio 高级版/企业版升级服务,大幅提升 API 调用频率GenStudio 于 2025 年 5 月 推出 GenStudio 高级版/企业版升级服务,大幅提升 API 调用频率 ,依然保留免费基础服务了解计费
Skip to content

模型介绍

Qwen3-8B 是 Qwen 系列第三代的大型语言模型,拥有 82 亿参数,专为高效推理和多语言任务设计。支持无缝切换思考模式(复杂推理)和非思考模式(通用对话),在数学、编码、常识推理及多语言指令执行中表现出色。

模型亮点

Qwen3-8B 提供以下关键特性:

  • 灵活模式切换:支持思考模式(逻辑推理、数学、编码)和非思考模式(高效对话),适配多种场景。
  • 强大推理能力:在数学、代码生成和常识推理方面超越 QwQ 和 Qwen2.5 模型。
  • 人类偏好对齐:在创意写作、角色扮演及多轮对话中提供自然且沉浸式体验。
  • 代理能力:与外部工具集成,表现出色,适合复杂代理任务。
  • 多语言支持:支持 100 多种语言和方言,具备强大的翻译和指令执行能力。
  • 模型规格:因果语言模型,82 亿参数,69.5 亿非嵌入参数,36 层,GQA 注意力(Q: 32, KV: 8)。

支持通过 enable_thinking 参数控制是否开启推理能力,默认关闭。

注意: 此模型的使用受许可协议的约束。请在下方查看相关的协议内容。

评测数据

详见 官方数据

许可协议

https://choosealicense.com/licenses/apache-2.0/

免责声明

限于技术特性,平台在尽到合理努力的前提下,仍无法完全保证您通过本服务获得的输出的合法性、真实性、准确性以及完整性。您应对本服务中的输出自行加以判断,并承担因使用内容引起的所有风险。平台不对前述风险导致的损失或损害承担责任。本服务下的输出不代表专业意见,不能代替法律、医疗、金融等专业领域从业人员的解答。相关观点仅限于算法触达的数据呈现的参考结果,不代表平台立场。由于机器学习特性,相同输入可能产生不同输出,请注意甄别。

找不到想要的答案?
让 AI 助手为您解答