无问芯穹文档

模型介绍

Megrez-3B-Instruct 是由无问芯穹完全自主训练的大语言模型。Megrez-3B-Instruct 旨在通过软硬协同理念，打造一款极速推理、小巧精悍、极易上手的端侧智能解决方案。

模型亮点

高精度：Megrez-3B-Instruct 虽然参数规模只有 3B，但通过数据质量的本质提升，成功弥合了模型性能代差，将上一代 14B 模型的能力高度压缩至 3B 大小，在主流榜单上取得了优秀的性能表现。
高速度：模型小≠速度快。Megrez-3B-Instruct 通过软硬协同优化，确保了各结构参数与主流硬件高度适配，最大推理速度领先同精度模型 300%。
简单易用：模型设计之初我们进行了激烈的讨论：应该在结构设计上留出更多软硬协同的空间（如 ReLU、稀疏化、更精简的结构等），还是使用经典结构便于直接用起来？我们选择了后者，即采用最原始的 LLaMA2 结构，开发者无需任何修改便可将模型部署于各种平台，最小化二次开发复杂度。
丰富应用：我们提供了完整的 WebSearch 方案，相比 search_with_lepton，我们对模型进行了针对性训练，使模型可以自动决策搜索调用时机，并提供更好的总结效果。用户可以基于该功能构建属于自己的 Kimi 或 Perplexity，克服小模型常见的幻觉问题和知识储备不足的局限。

许可协议

https://www.apache.org/licenses/LICENSE-2.0

免责声明

限于技术特性，平台在尽到合理努力的前提下，仍无法完全保证您通过本服务获得的输出的合法性、真实性、准确性以及完整性。您应对本服务中的输出自行加以判断，并承担因使用内容引起的所有风险。我们提示您，除法律有明确规定外，平台无法也不会对前述风险而导致的任何损失或损害承担责任。本服务下的输出不代表专业意见，不能代替如法律、医疗、金融等专业领域从业人员向您解答对应疑问。相关观点也仅限于算法所触达有限数据呈现的供您参考的结果，并不代表平台立场。由于机器学习特性，就相同的输入可能产生不同的输出结果，请您注意甄别。