模型介绍

jina-embeddings-v2 系列是 JINA AI 自主研发的第二代 Embedding 系列模型。

模型亮点

jina-embeddings-v2-base-zh 是支持中英双语的文本向量模型,支持长达 8192 字符的文本编码。该模型的研发基于 BERT 架构(JinaBERT),JinaBERT 是在 BERT 架构基础上的改进,首次将 ALiBi 应用到编码器架构中以支持更长的序列。 不同于以往的单语言/多语言向量模型,该模型设计双语模型来更好的支持单语言(中搜中)以及跨语言(中搜英)文档检索。

注意

此模型的使用受 Apache 2.0 许可协议的约束。请在下方查看相关的协议内容。

许可协议

https://huggingface.co/datasets/choosealicense/licenses/blob/main/markdown/apache-2.0.md

免责声明

限于技术特性,平台在尽到合理努力的前提下,仍无法完全保证您通过本服务获得的输出的合法性、真实性、准确性以及完整性。您应对本服务中的输出自行加以判断,并承担因使用内容引起的所有风险。 我们提示您,除法律有明确规定外,平台无法也不会对前述风险而导致的任何损失或损害承担责任。本服务下的输出不代表专业意见,不能代替如法律、医疗、金融等专业领域从业人员向您解答对应疑问。相关观点也仅限于算法所触达有限数据呈现的供您参考的结果,并不代表平台立场。 由于机器学习特性,就相同的输入可能产生不同的输出结果,请您注意甄别。