GenStudio API 服务概览
欢迎使用大模型服务平台(GenStudio)API 服务。本文档提供 GenStudio API 的全面概览,帮助您了解可用的 API 端点、支持的模型类型以及常见问题解答。
API 端点类型
GenStudio 提供多种 API 接口,兼容主流 AI 开发框架和工具:
OpenAI 兼容接口
Chat Completions 接口:标准的对话补全接口,支持大语言模型和视觉语言模型
- 端点:
https://cloud.infini-ai.com/maas/v1/chat/completions - 兼容 OpenAI SDK 和所有支持 OpenAI API 的工具
- 端点:
M×N Chat Completions 接口:支持指定不同厂商芯片的推理接口
- 端点:
https://cloud.infini-ai.com/maas/{model_id}/{chip_type}/chat/completions - 仅支持语言模型和视觉模型
- 详见:大语言模型 M×N API 教程
- 端点:
Embeddings 接口:文本向量化接口
- 端点:
https://cloud.infini-ai.com/maas/v1/embeddings - 详见:向量嵌入模型 API 教程
- 端点:
Anthropic 兼容接口
- Messages 接口:Anthropic Claude 风格的消息接口
- 端点:
https://cloud.infini-ai.com/maas/v1/messages - 适用于 Claude Code、Cursor 等工具
- GenStudio 为部分模型提供此接口,具体支持的模型请在模型广场使用「Claude 兼容」筛选
- 详见:使用 Claude Code 集成 GenStudio API
- 端点:
Rerank 接口
- Rerank 接口:搜索结果重排序接口
- 端点:
https://cloud.infini-ai.com/maas/v1/rerank - 详见:重排序模型 API 教程
- 端点:
视频生成模型接口
- 闭源视频生成模型采用与原厂一致的 API 端点
- 具体端点和参数请查看 GenStudio 模型广场中对应模型的详情页
模型服务类型
GenStudio 提供多种类型的模型 API 服务:
预置模型 API
平台预置的开源和闭源模型,开箱即用:
- 大语言模型 / 视觉语言模型:文本生成、对话、图像理解
- 嵌入模型:文本向量化、语义搜索
- 重排序模型:搜索结果优化
- 图像生成模型:文本到图像生成
- 视频生成模型:文本/图像到视频生成
预置模型列表会不定期更新,请访问模型广场查看最新可用模型:
注意
GenStudio 预置大语言模型支持在线聊天体验和多模型效果对比(不支持保存会话历史记录)。详见在线体验。
自部署模型 API
将微调后的模型部署到独占实例,提供私有 API 服务:
- 部署 ID 格式:
mif-前缀(如mif-c7kxdnah6nu5lrpw) - API 端点:
https://cloud.infini-ai.com/maas/deployment/{deployment_id}/chat/completions
注意
GenStudio 自部署模型目前仅面向授权企业客户开放。详见创建模型服务
API 使用流程
获取 API 密钥。
访问模型广场,根据任务类型(文本生成、代码生成、深度推理、工具调用等)、上下文长度、性能需求等选择合适的模型。
集成使用
API 参考文档
GenStudio 提供基于 OpenAPI 规范的完整 API 参考文档:
常见问题
如何查看支持的模型列表?
GenStudio 集成并维护了来自主流厂商的模型服务(称为预置模型)。模型列表会不定期更新,文档中不列出具体模型。
请访问 GenStudio 模型广场查看。模型广场支持按分类筛选:
- 大语言模型
- 生图大模型
- 视频大模型
- 向量模型
- 重排序模型
- 多模态模型
- 语音大模型
如何查看模型的上下文长度和最大生成长度?
模型广场的每个模型卡片和模型详情页会显示:
- 适合的任务类型(如文本生成、代码生成、深度推理、工具调用等)
- 上下文长度(Context Length)
- 最大生成长度(Max Output Tokens)
- 推理速度和定价信息
如需查找长文本模型,可以在模型广场按上下文长度排序或筛选。
哪些模型支持 Anthropic Messages 接口?
GenStudio 为部分模型提供 Anthropic Messages 兼容接口。具体支持的模型,请在模型广场使用「Claude 兼容」筛选查看。
如何找到 API 端点的 404 错误?
404 错误通常是因为 API URL 配置错误。不同工具处理 API URL 的方式不同,请注意:
- 有些工具会自动拼接
/v1/chat/completions等路径,您只需提供 Base URL - 有些工具需要完整的端点 URL
GenStudio API 端点格式说明:
- 标准 LLM API:
https://cloud.infini-ai.com/maas/v1/chat/completions - M×N API:
https://cloud.infini-ai.com/maas/{model_id}/{chip_type}/chat/completions - 自部署服务:
https://cloud.infini-ai.com/maas/deployment/{deployment_id}/chat/completions - Anthropic Messages:
https://cloud.infini-ai.com/maas/v1/messages - Embeddings:
https://cloud.infini-ai.com/maas/v1/embeddings - Rerank:
https://cloud.infini-ai.com/maas/v1/rerank
API 调用如何计费?
GenStudio API 调用计费取决于:
- 服务等级:租户的服务等级决定是否计费和 API 频率上限
- 模型定价:不同模型有不同的输入/输出价格
- Token 用量:按实际消耗的 Token 数量计费
租户可在服务列表页面查看全部模型价格(区分输入与输出价格)。如享受折扣,显示折后价。
API 有哪些频率限制?
GenStudio API 有以下限制:
- 每分钟请求数(RPM)
- 每日请求数(RPD)
- 每分钟 Token 数(TPM)
- 并发请求数
- 服务并发数
- 服务配额
具体限制取决于您的服务等级。详见:API 频率限制
遇到 API 错误如何排查?
- 查看错误码:GenStudio API 返回标准错误码,详见 API 错误码文档
- 检查配置:确认 API 密钥、端点 URL、模型 ID 是否正确
- 检查余额:确认账户余额充足
- 检查限制:确认未超过 API 频率限制
常见错误码:
400 Bad Request:请求参数错误401 Unauthorized:API 密钥无效或过期402 Payment Required:账户余额不足404 Not Found:API 端点不存在429 Too Many Requests:超出频率限制503 Service Unavailable:服务暂时不可用