在 AIStudio 镜像中心使用 Dockerfile 自助构建最新版 vLLM 镜像在 AIStudio 镜像中心使用 Dockerfile 自助构建最新版 vLLM 镜像 ,无需访问 DockerHub立即构建
Skip to content

GenStudio API 服务概览

欢迎使用大模型服务平台(GenStudio)API 服务。本文档提供 GenStudio API 的全面概览,帮助您了解可用的 API 端点、支持的模型类型以及常见问题解答。

API 端点类型

GenStudio 提供多种 API 接口,兼容主流 AI 开发框架和工具:

OpenAI 兼容接口

  • Chat Completions 接口:标准的对话补全接口,支持大语言模型和视觉语言模型

    • 端点:https://cloud.infini-ai.com/maas/v1/chat/completions
    • 兼容 OpenAI SDK 和所有支持 OpenAI API 的工具
  • M×N Chat Completions 接口:支持指定不同厂商芯片的推理接口

    • 端点:https://cloud.infini-ai.com/maas/{model_id}/{chip_type}/chat/completions
    • 仅支持语言模型和视觉模型
    • 详见:大语言模型 M×N API 教程
  • Embeddings 接口:文本向量化接口

Anthropic 兼容接口

  • Messages 接口:Anthropic Claude 风格的消息接口
    • 端点:https://cloud.infini-ai.com/maas/v1/messages
    • 适用于 Claude Code、Cursor 等工具
    • GenStudio 为部分模型提供此接口,具体支持的模型请在模型广场使用「Claude 兼容」筛选
    • 详见:使用 Claude Code 集成 GenStudio API

Rerank 接口

  • Rerank 接口:搜索结果重排序接口

视频生成模型接口

  • 闭源视频生成模型采用与原厂一致的 API 端点
  • 具体端点和参数请查看 GenStudio 模型广场中对应模型的详情页

模型服务类型

GenStudio 提供多种类型的模型 API 服务:

预置模型 API

平台预置的开源和闭源模型,开箱即用:

  • 大语言模型 / 视觉语言模型:文本生成、对话、图像理解
  • 嵌入模型:文本向量化、语义搜索
  • 重排序模型:搜索结果优化
  • 图像生成模型:文本到图像生成
  • 视频生成模型:文本/图像到视频生成

预置模型列表会不定期更新,请访问模型广场查看最新可用模型:

注意

GenStudio 预置大语言模型支持在线聊天体验和多模型效果对比(不支持保存会话历史记录)。详见在线体验

自部署模型 API

将微调后的模型部署到独占实例,提供私有 API 服务:

  • 部署 ID 格式:mif- 前缀(如 mif-c7kxdnah6nu5lrpw
  • API 端点:https://cloud.infini-ai.com/maas/deployment/{deployment_id}/chat/completions

注意

GenStudio 自部署模型目前仅面向授权企业客户开放。详见创建模型服务

API 使用流程

  1. 获取 API 密钥。

  2. 访问模型广场,根据任务类型(文本生成、代码生成、深度推理、工具调用等)、上下文长度、性能需求等选择合适的模型。

  3. 集成使用

API 参考文档

GenStudio 提供基于 OpenAPI 规范的完整 API 参考文档:

常见问题

如何查看支持的模型列表?

GenStudio 集成并维护了来自主流厂商的模型服务(称为预置模型)。模型列表会不定期更新,文档中不列出具体模型。

请访问 GenStudio 模型广场查看。模型广场支持按分类筛选:

  • 大语言模型
  • 生图大模型
  • 视频大模型
  • 向量模型
  • 重排序模型
  • 多模态模型
  • 语音大模型

如何查看模型的上下文长度和最大生成长度?

模型广场的每个模型卡片和模型详情页会显示:

  • 适合的任务类型(如文本生成、代码生成、深度推理、工具调用等)
  • 上下文长度(Context Length)
  • 最大生成长度(Max Output Tokens)
  • 推理速度和定价信息

如需查找长文本模型,可以在模型广场按上下文长度排序或筛选。

哪些模型支持 Anthropic Messages 接口?

GenStudio 为部分模型提供 Anthropic Messages 兼容接口。具体支持的模型,请在模型广场使用「Claude 兼容」筛选查看。

如何找到 API 端点的 404 错误?

404 错误通常是因为 API URL 配置错误。不同工具处理 API URL 的方式不同,请注意:

  • 有些工具会自动拼接 /v1/chat/completions 等路径,您只需提供 Base URL
  • 有些工具需要完整的端点 URL

GenStudio API 端点格式说明

  • 标准 LLM APIhttps://cloud.infini-ai.com/maas/v1/chat/completions
  • M×N APIhttps://cloud.infini-ai.com/maas/{model_id}/{chip_type}/chat/completions
  • 自部署服务https://cloud.infini-ai.com/maas/deployment/{deployment_id}/chat/completions
  • Anthropic Messageshttps://cloud.infini-ai.com/maas/v1/messages
  • Embeddingshttps://cloud.infini-ai.com/maas/v1/embeddings
  • Rerankhttps://cloud.infini-ai.com/maas/v1/rerank

详见:API 错误码 - 404 错误

API 调用如何计费?

GenStudio API 调用计费取决于:

  1. 服务等级:租户的服务等级决定是否计费和 API 频率上限
  2. 模型定价:不同模型有不同的输入/输出价格
  3. Token 用量:按实际消耗的 Token 数量计费

租户可在服务列表页面查看全部模型价格(区分输入与输出价格)。如享受折扣,显示折后价。

详见:API 服务等级与计费规则

API 有哪些频率限制?

GenStudio API 有以下限制:

  • 每分钟请求数(RPM)
  • 每日请求数(RPD)
  • 每分钟 Token 数(TPM)
  • 并发请求数
  • 服务并发数
  • 服务配额

具体限制取决于您的服务等级。详见:API 频率限制

遇到 API 错误如何排查?

  1. 查看错误码:GenStudio API 返回标准错误码,详见 API 错误码文档
  2. 检查配置:确认 API 密钥、端点 URL、模型 ID 是否正确
  3. 检查余额:确认账户余额充足
  4. 检查限制:确认未超过 API 频率限制

常见错误码:

  • 400 Bad Request:请求参数错误
  • 401 Unauthorized:API 密钥无效或过期
  • 402 Payment Required:账户余额不足
  • 404 Not Found:API 端点不存在
  • 429 Too Many Requests:超出频率限制
  • 503 Service Unavailable:服务暂时不可用