模型介绍
Megrez-3B-Instruct 是由无问芯穹完全自主训练的大语言模型。Megrez-3B-Instruct 旨在通过软硬协同理念,打造一款极速推理、小巧精悍、极易上手的端侧智能解决方案。
模型亮点
- 高精度:Megrez-3B-Instruct 虽然参数规模只有 3B,但通过数据质量的本质提升,成功弥合了模型性能代差,将上一代 14B 模型的能力高度压缩至 3B 大小,在主流榜单上取得了优秀的性能表现。
- 高速度:模型小≠速度快。Megrez-3B-Instruct 通过软硬协同优化,确保了各结构参数与主流硬件高度适配,最大推理速度领先同精度模型 300%。
- 简单易用:模型设计之初我们进行了激烈的讨论:应该在结构设计上留出更多软硬协同的空间(如 ReLU、稀疏化、更精简的结构等),还是使用经典结构便于直接用起来?我们选择了后者,即采用最原始的 LLaMA2 结构,开发者无需任何修改便可将模型部署于各种平台,最小化二次开发复杂度。
- 丰富应用:我们提供了完整的 WebSearch 方案,相比 search_with_lepton,我们对模型进行了针对性训练,使模型可以自动决策搜索调用时机,并提供更好的总结效果。用户可以基于该功能构建属于自己的 Kimi 或 Perplexity,克服小模型常见的幻觉问题和知识储备不足的局限。
许可协议
https://www.apache.org/licenses/LICENSE-2.0
免责声明
限于技术特性,平台在尽到合理努力的前提下,仍无法完全保证您通过本服务获得的输出的合法性、真实性、准确性以及完整性。您应对本服务中的输出自行加以判断,并承担因使用内容引起的所有风险。 我们提示您,除法律有明确规定外,平台无法也不会对前述风险而导致的任何损失或损害承担责任。本服务下的输出不代表专业意见,不能代替如法律、医疗、金融等专业领域从业人员向您解答对应疑问。相关观点也仅限于算法所触达有限数据呈现的供您参考的结果,并不代表平台立场。 由于机器学习特性,就相同的输入可能产生不同的输出结果,请您注意甄别。