GenStudio 重排序 (Rerank) 模型 API 教程
本教程将介绍如何使用 GenStudio 的重排序 (Rerank) 模型 API 重新评估和重新排序一组文档。
什么是重排序 (Rerank)?
重排序是一种专门用于改善搜索相关性的模型。它通过重新评估和重新排序一组文档来提高搜索质量。重排序模型接收查询和一组文本输入 (称为 "文档"),并为每个文档返回与给定查询相关的相关性分数。
在检索增强生成 (RAG) 流程中,重排序步骤位于初始检索和最终生成阶段之间,充当质量过滤器,优化将用作语言模型上下文的文档选择。
支持的重排序模型
NOTE
关于 Rerank API 端点的路径、参数、限制等细节,详见 GenStudio 重排序 API 参考文档。
使用示例:基础文本重排序
无问芯穹提供与主流厂商类似的 Rerank API,一般情况下,只需更改 URL 和 API 密钥即可切换。
以下是一个简单的文本重排序示例:
bash
curl -X POST https://cloud.infini-ai.com/maas/v1/rerank \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "bge-reranker-v2-m3",
"query": "在秘鲁附近可以找到什么动物?",
"documents": [
"大熊猫是中国特有的熊科动物。",
"羊驼是南美洲驼科动物,自前哥伦布时代以来被安第斯文化广泛用作肉食和驮运动物。",
"野生双峰驼是一种濒危的驼科动物,主要分布在中国西北和蒙古西南部。",
"原驼是南美洲驼科动物,与羊驼近亲。原驼是南美洲两种野生驼科动物之一,另一种是生活在更高海拔的小羊驼。"
]
}'
TIP
调用大模型服务平台的任何 API,均需要通过 API Key 进行鉴权。首次使用时,您需要创建一个 API Key。请前往密钥管理页面创建 API 密钥。
重要提示
设置 return_documents
为 true
可以在响应中包含完整文档内容。
NOTE
- 排序文档暂仅支持字符串类型。
documents
字段暂仅支持 Array of Strings,暂不支持 Array of Objects。 - 暂不支持
rank_fields
、top_n
、truncate
、truncate_direction
等参数。
应用场景
- 搜索引擎结果优化
- 知识库检索增强
- 智能问答系统
- 文档相关性排序
- 邮件搜索优化
重排序模型 API 限频
为了保障服务的稳定性及合理使用,GenStudio 对 API 服务进行频率限制。您可以阅读 API 限频以获取更多信息。