GenStudio API 服务概览

欢迎使用大模型服务平台（GenStudio）API 服务。本文档提供 GenStudio API 的全面概览，帮助您了解可用的 API 端点、支持的模型类型以及常见问题解答。

API 端点类型

GenStudio 提供多种 API 接口，兼容主流 AI 开发框架和工具：

OpenAI 兼容接口

Chat Completions 接口：标准的对话补全接口，支持大语言模型和视觉语言模型
- 端点：https://cloud.infini-ai.com/maas/v1/chat/completions
- 兼容 OpenAI SDK 和所有支持 OpenAI API 的工具
M×N Chat Completions 接口：支持指定不同厂商芯片的推理接口
- 端点：https://cloud.infini-ai.com/maas/{model_id}/{chip_type}/chat/completions
- 仅支持语言模型和视觉模型
- 详见：大语言模型 M×N API 教程
Embeddings 接口：文本向量化接口
- 端点：https://cloud.infini-ai.com/maas/v1/embeddings
- 详见：向量嵌入模型 API 教程

Anthropic 兼容接口

Messages 接口：Anthropic Claude 风格的消息接口
- 端点：https://cloud.infini-ai.com/maas/v1/messages
- 适用于 Claude Code、Cursor 等工具
- GenStudio 为部分模型提供此接口，具体支持的模型请在模型广场使用「Claude 兼容」筛选
- 详见：使用 Claude Code 集成 GenStudio API

Rerank 接口

Rerank 接口：搜索结果重排序接口
- 端点：https://cloud.infini-ai.com/maas/v1/rerank
- 详见：重排序模型 API 教程

视频生成模型接口

闭源视频生成模型采用与原厂一致的 API 端点
具体端点和参数请查看 GenStudio 模型广场中对应模型的详情页

模型广场

模型服务类型

GenStudio 提供多种类型的模型 API 服务：

预置模型 API

平台预置的开源和闭源模型，开箱即用：

大语言模型 / 视觉语言模型：文本生成、对话、图像理解
嵌入模型：文本向量化、语义搜索
重排序模型：搜索结果优化
图像生成模型：文本到图像生成
视频生成模型：文本/图像到视频生成

预置模型列表会不定期更新，请访问模型广场查看最新可用模型：

查看预置模型

注意

GenStudio 预置大语言模型支持在线聊天体验和多模型效果对比（不支持保存会话历史记录）。详见在线体验。

自部署模型 API

将微调后的模型部署到独占实例，提供私有 API 服务：

部署 ID 格式：mif- 前缀（如 mif-c7kxdnah6nu5lrpw）
API 端点：https://cloud.infini-ai.com/maas/deployment/{deployment_id}/chat/completions

注意

GenStudio 自部署模型目前仅面向授权企业客户开放。详见创建模型服务

API 使用流程

获取 API 密钥。
获取 API 密钥
访问模型广场，根据任务类型（文本生成、代码生成、深度推理、工具调用等）、上下文长度、性能需求等选择合适的模型。
浏览模型
集成使用
- 第三方工具集成：详见 API 快速集成
- 代码集成：详见 API 快速集成

API 参考文档

GenStudio 提供基于 OpenAPI 规范的完整 API 参考文档：

常见问题

如何查看支持的模型列表？

GenStudio 集成并维护了来自主流厂商的模型服务（称为预置模型）。模型列表会不定期更新，文档中不列出具体模型。

请访问 GenStudio 模型广场查看。模型广场支持按分类筛选：

大语言模型
生图大模型
视频大模型
向量模型
重排序模型
多模态模型
语音大模型

模型广场

如何查看模型的上下文长度和最大生成长度？

模型广场的每个模型卡片和模型详情页会显示：

适合的任务类型（如文本生成、代码生成、深度推理、工具调用等）
上下文长度（Context Length）
最大生成长度（Max Output Tokens）
推理速度和定价信息

如需查找长文本模型，可以在模型广场按上下文长度排序或筛选。

哪些模型支持 Anthropic Messages 接口？

GenStudio 为部分模型提供 Anthropic Messages 兼容接口。具体支持的模型，请在模型广场使用「Claude 兼容」筛选查看。

查看支持 Claude 兼容的模型

注意

如您已订阅 Infini 编码套餐 (Coding Plan) ，请注意编码套餐仅支持部分模型。请访问平台编码套餐页面，以实际显示为准。

如何找到 API 端点的 404 错误？

404 错误通常是因为 API URL 配置错误。不同工具处理 API URL 的方式不同，请注意：

有些工具会自动拼接 /v1/chat/completions 等路径，您只需提供 Base URL
有些工具需要完整的端点 URL

GenStudio API 端点格式说明：

标准 LLM API：https://cloud.infini-ai.com/maas/v1/chat/completions
M×N API：https://cloud.infini-ai.com/maas/{model_id}/{chip_type}/chat/completions
自部署服务：https://cloud.infini-ai.com/maas/deployment/{deployment_id}/chat/completions
Anthropic Messages：https://cloud.infini-ai.com/maas/v1/messages
Embeddings：https://cloud.infini-ai.com/maas/v1/embeddings
Rerank：https://cloud.infini-ai.com/maas/v1/rerank

详见：API 错误码 - 404 错误

API 调用如何计费？

GenStudio API 调用计费取决于：

服务等级：租户的服务等级决定是否计费和 API 频率上限
模型定价：不同模型有不同的输入/输出价格
Token 用量：按实际消耗的 Token 数量计费

租户可在服务列表页面查看全部模型价格（区分输入与输出价格）。如享受折扣，显示折后价。

查看服务列表和价格

详见：API 服务等级与计费规则

API 有哪些频率限制？

GenStudio API 有以下限制：

每分钟请求数（RPM）
每日请求数（RPD）
每分钟 Token 数（TPM）
并发请求数
服务并发数
服务配额

具体限制取决于您的服务等级。详见：API 频率限制

遇到 API 错误如何排查？

查看错误码：GenStudio API 返回标准错误码，详见 API 错误码文档
检查配置：确认 API 密钥、端点 URL、模型 ID 是否正确
检查余额：确认账户余额充足
检查限制：确认未超过 API 频率限制

常见错误码：

400 Bad Request：请求参数错误
401 Unauthorized：API 密钥无效或过期
402 Payment Required：账户余额不足
404 Not Found：API 端点不存在
429 Too Many Requests：超出频率限制
503 Service Unavailable：服务暂时不可用

GenStudio API 服务概览 ​

API 端点类型 ​

OpenAI 兼容接口 ​

Anthropic 兼容接口 ​

Rerank 接口 ​

视频生成模型接口 ​

模型服务类型 ​

预置模型 API ​

自部署模型 API ​

API 使用流程 ​

API 参考文档 ​

常见问题 ​

如何查看支持的模型列表？ ​

如何查看模型的上下文长度和最大生成长度？ ​

哪些模型支持 Anthropic Messages 接口？ ​

如何找到 API 端点的 404 错误？ ​

API 调用如何计费？ ​

API 有哪些频率限制？ ​

遇到 API 错误如何排查？ ​