GenStudio API 错误码
本文档列出了 GenStudio API 可能返回的所有错误码,包括错误信息、原因和解决方案。
4xx 客户端错误
400 Bad Request
请求格式或参数存在问题时返回的错误。
| 错误码 | 错误信息 | 说明及解决方案 |
|---|---|---|
| 10001 | "Invalid Field %v" | 请求参数格式或值不正确,请检查请求参数的格式和取值范围 |
| 20004 | "Json marshal fail %v" | 请求体 JSON 格式错误,请检查 JSON 语法是否正确 |
| 10007 | "Bad Request: %v" | 请求格式不符合要求,请检查请求格式和参数设置 |
| 70000 | "Exceeding the limiting length: %v" | 生成长度超出模型限制,请适当减少 max_tokens 参数值 |
| 40301 | "The model %s does not exist or you do not have access to it." | 模型不存在或无访问权限,请确认模型 ID 正确且已获得相应权限 |
401 Unauthorized
身份验证失败或权限不足时返回的错误。
| 错误码 | 错误信息 | 说明及解决方案 |
|---|---|---|
| 10008 | "暂无该模型访问权限,请到官网进行申请" | 当前账户暂无该模型的访问权限,请前往官网申请相应权限 |
| 10009 | "请使用正确的 api key 进行请求" | API Key 无效或已失效,请检查 API Key 是否正确且处于有效状态 |
| 10003 | "Not login" | 用户身份验证失败,请确保已正确完成身份验证 |
402 Payment Required
账户余额或付费状态相关的错误。
| 错误码 | 错误信息 | 说明及解决方案 |
|---|---|---|
| 10017 | "CashAccount: not enough balance" | 账户余额不足,请及时充值以继续使用服务 |
404 Not Found
请求的资源或端点不存在时返回的错误。
| 错误码 | 错误信息 | 说明及解决方案 |
|---|---|---|
| 10006 | "Route Not Found" | 请求的 API 端点不存在,请检查 URL 路径是否正确 |
| 20404 | "Not found error: %v" | 请求的资源未找到,请确认 API 端点 URL 是否正确 |
413 Request Entity Too Large
请求内容超出大小限制时返回的错误。
| 错误码 | 错误信息 | 说明及解决方案 |
|---|---|---|
| 10019 | "Request body too large" | 请求内容超出大小限制,请适当减少请求体的大小 |
429 Too Many Requests
超出请求频率或并发限制时返回的错误。
| 错误码 | 错误信息 | 说明及解决方案 |
|---|---|---|
| 20021 | "TPM exceeded at apikey level." | 每分钟令牌数超出限制,请适当降低请求频率(一般不设 API 级别限制) |
| 20020 | "RPD exceeded at apikey level." | 每日请求数超出限制,请适当降低请求频率(一般不设 API 级别限制) |
| 20013 | "RPM exceeded at apikey level." | 每分钟请求数超出限制,请适当降低请求频率(一般不设 API 级别限制) |
| 20013 | "Concurrency exceeded." | 并发请求数超出限制,请减少同时进行的请求数量 |
| 20013 | "Service concurrency exceeded." | 服务并发数超出限制,请减少同时进行的请求数量 |
| 20013 | "Service quota exceeded." | 服务配额已用尽,请联系技术支持获取帮助 |
5xx 服务器错误
503 Service Unavailable
服务暂时不可用或维护中时返回的错误。
| 错误码 | 错误信息 | 说明及解决方案 |
|---|---|---|
| 20022 | "Connection Failed: %v" | 服务连接失败,请稍后重试或联系技术支持 |
| 10010 | "推理服务不在运行中,请检查后再重试" | 推理服务暂时不可用,请稍后重试或联系技术支持 |
| 20002 | "Set session error %v" | 会话设置失败,请稍后重试或联系技术支持 |
错误处理最佳实践
- 重试机制:对于 5xx 错误和部分 429 错误,建议实现指数退避重试机制
- 错误日志:记录完整的错误信息,包括错误码和错误消息,便于问题排查
联系支持
如果遇到文档中未列出的错误或需要技术支持,请联系我们的技术支持团队。
常见问题
大模型服务平台 LLM API 返回 404 错误
404 错误,一般是因为 API 域名路径配置错误。由于第三方工具在处理 API URL 时存在一定差异,请尤其注意以下几点:
- 工具是否自行拼接
/v1/chat/completions、/v1/embeddings、/v1/messages等片段,无需用户填写。 - 工具是否自行拼接
/v1片段,无需用户填写 - 工具是否要求用户填写完整的 API 请求地址
以下概述了 GenStudio 各个 API 服务的 Base URL 和端点的路径组成。
大语言模型 API 接口(OpenAI 兼容): GenStudio 为预置大语言模型实现了 OpenAI 的 Chat Completions 接口。API 端点示例:
https://cloud.infini-ai.com+/maas+/v1/chat/completions大语言模型 M×N 多模型芯片 API 接口(OpenAI 兼容): GenStudio 为部分预置大语言模型适配了多芯片推理,使用专用 API 端点。API 端点示例:
https://cloud.infini-ai.com+/maas+/megrez-7b-instruct+/nvidia+/chat/completions其中
megrez-7b-instruct是模型 ID;nvidia是推理芯片类型。在构建 API 请求时,您需要根据当前使用的模型和芯片替换为真实值。自部署大语言模型 API 服务(OpenAI 兼容):将微调后的模型部署到独占实例,可提供私有 API 服务。API 端点示例:
https://cloud.infini-ai.com+/maas/+/deployment+/mif-c7kxdnah6nu5lrpw+/chat/completions其中
mif-c7kxdnah6nu5lrpw是模型服务的部署 ID,该 ID 一定带有mif-前缀。大语言模型 API 接口(Anthropic 兼容): GenStudio 为预置大语言模型实现了 Anthropic 的 Messages 接口,可用于接入 Claude Code。API 端点示例:
https://cloud.infini-ai.com+/maas+/v1/messages向量嵌入模型 API 服务: GenStudio 预置向量嵌入模型 API 端点示例:
https://cloud.infini-ai.com+/maas+/v1/embeddings重排序模型 API 服务: GenStudio 重排序模型 API 端点示例:
https://cloud.infini-ai.com+/maas+/v1/rerank