2024-11-21 一站式 AI 平台生日大派对!2024-11-21 一站式 AI 平台生日大派对! 无问芯穹特别推出多项超值福利!立即参与
Skip to content

GenStudio 重排序 (Rerank) 模型 API 教程

本教程将介绍如何使用 GenStudio 的重排序 (Rerank) 模型 API 重新评估和重新排序一组文档。

什么是重排序 (Rerank)?

重排序是一种专门用于改善搜索相关性的模型。它通过重新评估和重新排序一组文档来提高搜索质量。重排序模型接收查询和一组文本输入 (称为 "文档"),并为每个文档返回与给定查询相关的相关性分数。

在检索增强生成 (RAG) 流程中,重排序步骤位于初始检索和最终生成阶段之间,充当质量过滤器,优化将用作语言模型上下文的文档选择。

支持的重排序模型

NOTE

关于 Rerank API 端点的路径、参数、限制等细节,详见 GenStudio 重排序 API 参考文档

使用示例:基础文本重排序

无问芯穹提供与主流厂商类似的 Rerank API,一般情况下,只需更改 URL 和 API 密钥即可切换。

以下是一个简单的文本重排序示例:

bash
curl -X POST https://cloud.infini-ai.com/maas/v1/rerank \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{
    "model": "bge-reranker-v2-m3",
    "query": "在秘鲁附近可以找到什么动物?",
    "documents": [
      "大熊猫是中国特有的熊科动物。",
      "羊驼是南美洲驼科动物,自前哥伦布时代以来被安第斯文化广泛用作肉食和驮运动物。",
      "野生双峰驼是一种濒危的驼科动物,主要分布在中国西北和蒙古西南部。",
      "原驼是南美洲驼科动物,与羊驼近亲。原驼是南美洲两种野生驼科动物之一,另一种是生活在更高海拔的小羊驼。"
    ]
  }'

TIP

调用大模型服务平台的任何 API,均需要通过 API Key 进行鉴权。首次使用时,您需要创建一个 API Key。请前往密钥管理页面创建 API 密钥。

重要提示

设置 return_documentstrue 可以在响应中包含完整文档内容。

NOTE

  • 排序文档暂仅支持字符串类型。documents 字段暂仅支持 Array of Strings,暂不支持 Array of Objects。
  • 暂不支持 rank_fieldstop_ntruncatetruncate_direction 等参数。

应用场景

  • 搜索引擎结果优化
  • 知识库检索增强
  • 智能问答系统
  • 文档相关性排序
  • 邮件搜索优化

重排序模型 API 限频

为了保障服务的稳定性及合理使用,GenStudio 对 API 服务进行频率限制。您可以阅读 API 限频以获取更多信息。