GenStudio 向量嵌入模型 API 教程
本教程将介绍如何使用 GenStudio 的嵌入模型 API 将文本转换为向量(即浮点数列表)。
支持的嵌入模型
GenStudio 已支持以下嵌入模型:
NOTE
关于 embeddings API 端点的路径、参数、限制等细节,详见 GenStudio 向量嵌入 API 参考文档。
什么是嵌入
文本嵌入用于衡量文本字符串之间的相关性。嵌入常用于以下场景:
- 搜索:根据查询字符串的相关性对结果进行排名
- 聚类:根据相似性对文本字符串进行分组
- 推荐:推荐与相关文本字符串相匹配的项目
- 异常检测:识别与其他文本相关性较低的异常项
- 多样性测量:分析相似性分布
- 分类:根据最相似的标签对文本字符串进行分类
一个嵌入是一个浮点数列表。两个嵌入向量之间的距离用于衡量它们的相关性。小的距离表示高相关性,大的距离表示低相关性。
访问我们的定价页面了解嵌入的费用。嵌入的请求是根据输入的令牌数量计费的。
如何获取嵌入
要获取嵌入,您需要将文本字符串发送到嵌入 API 端点,并指定嵌入模型名称(如 jina-embeddings-v2-base-zh
)。响应将包含一个嵌入向量(浮点数列表),您可以提取并将其保存到向量数据库中,用于不同的用例。
示例:获取嵌入
bash
curl https://cloud.infini-ai.com/maas/v1/embeddings \
-H "Content-Type: application/json" \
-H "Authorization: Bearer xxx" \
-d '{
"model": "jina-embeddings-v2-base-zh",
"input": [
"您的查询可以是中文",
"or in English only",
"或是query-doc中英混杂的like this one.",
"每个文本最多可以有8192个词元"
]}'
TIP
调用大模型服务平台的任何 API,均需要通过 API Key 进行鉴权。首次使用时,您需要创建一个 API Key。请前往密钥管理页面创建 API 密钥。
示例:嵌入响应
json
{
"data": [
{
"object": "embedding",
"embedding": [
0.0023064255,
-0.009327292,
....
-0.0028842222,
],
"index": 0
}
],
"model":"jina-embeddings-v2-base-zh",
"object":"list",
"usage":{"prompt_tokens":23,"total_tokens":23},
}
嵌入模型 API 限频
为了保障服务的稳定性及合理使用,GenStudio 对 API 服务进行频率限制。您可以阅读 API 限频以获取更多信息。