无问芯穹文档

模型介绍

jina-embeddings-v2 系列是 JINA AI 自主研发的第二代 Embedding 系列模型。

模型亮点

jina-embeddings-v2-base-zh 是支持中英双语的文本向量模型，支持长达 8192 字符的文本编码。该模型的研发基于 BERT 架构(JinaBERT)，JinaBERT 是在 BERT 架构基础上的改进，首次将 ALiBi 应用到编码器架构中以支持更长的序列。不同于以往的单语言/多语言向量模型，该模型设计双语模型来更好的支持单语言（中搜中）以及跨语言（中搜英）文档检索。

注意

此模型的使用受 Apache 2.0 许可协议的约束。请在下方查看相关的协议内容。

许可协议

https://huggingface.co/datasets/choosealicense/licenses/blob/main/markdown/apache-2.0.md

免责声明

限于技术特性，平台在尽到合理努力的前提下，仍无法完全保证您通过本服务获得的输出的合法性、真实性、准确性以及完整性。您应对本服务中的输出自行加以判断，并承担因使用内容引起的所有风险。我们提示您，除法律有明确规定外，平台无法也不会对前述风险而导致的任何损失或损害承担责任。本服务下的输出不代表专业意见，不能代替如法律、医疗、金融等专业领域从业人员向您解答对应疑问。相关观点也仅限于算法所触达有限数据呈现的供您参考的结果，并不代表平台立场。由于机器学习特性，就相同的输入可能产生不同的输出结果，请您注意甄别。