GenStudio LLM API 错误码
本页适用于 GenStudio 的 LLM、向量嵌入和重排序等兼容接口。此类接口返回错误时,通常使用 HTTP 状态码表达请求处理结果,并在响应体中返回 code 和 msg 字段。
language-json
{
"code": 10009,
"msg": "请使用正确的api key进行请求"
}响应字段:
code:GenStudio 返回的业务错误码或系统错误码。msg:错误信息。本文档中用{...}表示运行时详情;实际响应会替换为具体字段、模型、限制值或失败原因。
400 Bad Request
请求格式、参数、模型 ID 或模型协议不符合要求。
10001
- 错误信息格式:
Invalid Field {field} - 可能原因:请求字段缺失、格式错误或取值不合法。
- 处理建议:按接口说明检查请求参数名称、类型和取值范围。
- 是否建议重试:否。
10007
- 错误信息格式:
Bad Request: {reason} - 可能原因:请求体、消息类型或其他请求条件不满足要求。
- 处理建议:根据返回的具体错误信息修改请求。
- 是否建议重试:否。
40301
- 错误信息格式:
The model {model} does not exist or you do not have access to it. - 可能原因:模型 ID 不存在、模型不可见,或当前兼容协议不支持该模型。
- 处理建议:确认模型 ID、API 路径和兼容协议匹配;Anthropic 兼容接口仅支持适配该协议的模型。
- 是否建议重试:否。
40302
- 错误信息格式:
Param {param} Invalid - 可能原因:聊天请求参数无效。
- 处理建议:根据返回的参数名修改请求参数。
- 是否建议重试:否。
70000
- 错误信息格式:
Exceeding the limiting length: {limit} - 可能原因:生成长度或输入内容超出模型限制。
- 处理建议:减少输入长度,或调低
max_tokens/max_completion_tokens。 - 是否建议重试:否。
401 Unauthorized
身份验证失败或 API Key 不可用。
10003
- 错误信息:"Not login"
- 可能原因:未登录,或请求未携带有效登录态。
- 处理建议:API 调用应使用有效 API Key;控制台请求请重新登录。
- 是否建议重试:否。
10009
- 错误信息:"请使用正确的api key进行请求"
- 可能原因:
Authorization请求头格式错误、API Key 无效或已失效。 - 处理建议:使用
Authorization: Bearer <API Key>,并确认 API Key 未删除、未过期。 - 是否建议重试:否。
10018
- 错误信息:"APIKEY 已被用户禁用, 请检查后再试"
- 可能原因:API Key 已被禁用。
- 处理建议:在控制台启用 API Key,或更换可用 API Key。
- 是否建议重试:否。
402 Payment Required
账户余额、预算或套餐状态不满足调用条件。
10017
- 错误信息:"CashAccount: not enough balance"
- 可能原因:账户余额不足。
- 处理建议:补足账户余额。余额恢复后,服务可能需要等待约 5 分钟自动恢复。
- 是否建议重试:否。
10024
- 错误信息:"当前账号消费已超过预算金额上限"
- 可能原因:账号消费达到预算上限。
- 处理建议:调整预算上限,或联系管理员处理预算限制。
- 是否建议重试:否。
403 Forbidden
当前租户或账号没有访问指定模型或 API 路径的权限。
10008
- 错误信息:"暂无该模型访问权限,请到官网进行申请"
- 可能原因:当前租户没有访问该模型的权限。
- 处理建议:确认模型是否已开通;如需使用该模型,请申请模型访问权限。
- 是否建议重试:否。
10025
- HTTP 状态码:
403。 - 错误信息格式:
{stop_service_message},常见返回为功能暂不可用。 - 可能原因:当前租户命中停服限制,暂不可访问该 API 路径。
- 处理建议:确认服务合同、白名单或停服策略状态;如需继续使用,请联系管理员或技术支持。
- 是否建议重试:否。
404 Not Found
请求路径、资源或端点不存在。
10006
- 错误信息:"Route Not Found"
- 可能原因:API 路径不存在,或 Base URL 与端点路径拼接错误。
- 处理建议:检查 Base URL、
/v1、/chat/completions、/messages等路径片段是否重复或缺失。 - 是否建议重试:否。
20404
- 错误信息格式:
Not found error: {reason} - 可能原因:请求的资源不存在。
- 处理建议:确认资源 ID、模型服务部署 ID 或其他路径参数是否正确。
- 是否建议重试:否。
413 Request Entity Too Large
请求体超过大小限制。
10019
- 错误信息:"Request body too large"
- 可能原因:请求体过大。
- 处理建议:减少消息数量、上下文长度、图片或音频等输入内容。
- 是否建议重试:否。
429 Too Many Requests
请求频率、Token 速率、并发或周期配额超过限制。
20013
- 错误信息格式:
{rate_limit_message}。 - 常见返回:
RPM exceeded at apikey level、RPD exceeded at apikey level、TPM exceeded at apikey level、RPM exceeded at tenant level、RPD exceeded at tenant level、TPM exceeded at tenant level、Concurrency exceeded.、Service concurrency exceeded.、Service quota exceeded. - 可能原因:单个 API Key、租户、规则或服务侧触发请求次数、Token 速率、并发或上游服务配额限制。
- 处理建议:降低请求频率和并发,减少输入长度或生成 Token 数;如果是服务侧并发能力不足,可购买包并发服务;如果是服务或资源配额限制,请稍后重试或联系技术支持。
- 是否建议重试:是。
5xx 服务端错误
服务端、上游推理服务或会话处理异常。
20004
- HTTP 状态码:
500。 - 错误信息格式:
Json marshal fail {reason} - 可能原因:服务端序列化响应失败。
- 处理建议:稍后重试;如持续出现,请记录请求 ID 并联系技术支持。
- 是否建议重试:是。
20023
- HTTP 状态码:
500。 - 错误信息:"系统繁忙,请稍后再试"
- 可能原因:服务端内部繁忙或内部错误。
- 处理建议:稍后重试;如持续出现,请联系技术支持。
- 是否建议重试:是。
10010
- HTTP 状态码:
503。 - 错误信息:"推理服务不在运行中,请检查后再重试"
- 可能原因:推理服务暂不可用或未运行。
- 处理建议:稍后重试;如持续出现,请联系技术支持。
- 是否建议重试:是。
20002
- HTTP 状态码:
503。 - 错误信息格式:
Set session error {reason} - 可能原因:登录态或会话信息处理失败。
- 处理建议:重新登录后重试;API 调用请确认使用 API Key。
- 是否建议重试:是。
20022
- HTTP 状态码:
503。 - 错误信息格式:
Connection Failed: {reason} - 可能原因:连接上游或后端服务失败。
- 处理建议:稍后重试;如持续出现,请联系技术支持。
- 是否建议重试:是。
错误处理和端点路径排查
错误处理建议
- 先判断响应形态:LLM 兼容接口先看 HTTP 状态码,再看响应体
code。 - 判断是否可重试:
400、401、402、403、404和413通常需要先修正请求、权限、余额或配置;429和5xx可按退避策略重试。 - 保留排查信息:记录 HTTP 状态码、响应体
code、msg、响应体id、响应头traceresponse、模型 ID、请求时间和耗时。 - 避免立即重放大请求:遇到
429、413或70000时,先降低并发、缩短上下文或减少生成长度。
LLM API 返回 404 错误
404 错误一般是因为 API 域名路径配置错误。由于第三方工具在处理 API URL 时存在一定差异,请尤其注意以下几点:
- 工具是否自行拼接
/v1/chat/completions、/v1/embeddings、/v1/messages等片段,无需用户填写。 - 工具是否自行拼接
/v1片段,无需用户填写。 - 工具是否要求用户填写完整的 API 请求地址。
- 如果 URL 组合无误,再检查模型 ID 是否可见,以及当前模型是否支持所选兼容协议。