2024-11-21 一站式 AI 平台生日大派对!2024-11-21 一站式 AI 平台生日大派对! 无问芯穹特别推出多项超值福利!立即参与
Skip to content

GenStudio 向量嵌入模型 API 教程

本教程将介绍如何使用 GenStudio 的嵌入模型 API 将文本转换为向量(即浮点数列表)。

支持的嵌入模型

GenStudio 已支持以下嵌入模型:

NOTE

关于 embeddings API 端点的路径、参数、限制等细节,详见 GenStudio 向量嵌入 API 参考文档

什么是嵌入

文本嵌入用于衡量文本字符串之间的相关性。嵌入常用于以下场景:

  • 搜索:根据查询字符串的相关性对结果进行排名
  • 聚类:根据相似性对文本字符串进行分组
  • 推荐:推荐与相关文本字符串相匹配的项目
  • 异常检测:识别与其他文本相关性较低的异常项
  • 多样性测量:分析相似性分布
  • 分类:根据最相似的标签对文本字符串进行分类

一个嵌入是一个浮点数列表。两个嵌入向量之间的距离用于衡量它们的相关性。小的距离表示高相关性,大的距离表示低相关性。

访问我们的定价页面了解嵌入的费用。嵌入的请求是根据输入的令牌数量计费的。

如何获取嵌入

要获取嵌入,您需要将文本字符串发送到嵌入 API 端点,并指定嵌入模型名称(如 jina-embeddings-v2-base-zh)。响应将包含一个嵌入向量(浮点数列表),您可以提取并将其保存到向量数据库中,用于不同的用例。

示例:获取嵌入

bash
curl https://cloud.infini-ai.com/maas/v1/embeddings \
    -H "Content-Type: application/json" \
    -H "Authorization: Bearer xxx" \
    -d '{
        "model": "jina-embeddings-v2-base-zh",
        "input": [
                "您的查询可以是中文", 
                "or in English only", 
                "或是query-doc中英混杂的like this one.", 
                "每个文本最多可以有8192个词元"
    ]}'

TIP

调用大模型服务平台的任何 API,均需要通过 API Key 进行鉴权。首次使用时,您需要创建一个 API Key。请前往密钥管理页面创建 API 密钥。

示例:嵌入响应

json
{ 
  "data": [
    {
      "object": "embedding",
      "embedding": [
        0.0023064255,
        -0.009327292,
        .... 
        -0.0028842222,
      ],
      "index": 0
    }
  ],
  "model":"jina-embeddings-v2-base-zh",
  "object":"list",
  "usage":{"prompt_tokens":23,"total_tokens":23},
}

嵌入模型 API 限频

为了保障服务的稳定性及合理使用,GenStudio 对 API 服务进行频率限制。您可以阅读 API 限频以获取更多信息。