GenStudio API 服务快速上手
欢迎使用⼤模型服务平台(GenStudio)。平台预置了多种功能开箱即用的开源闭源模型 API 服务,包括但不限于:
- 大语言模型 / 视觉语言模型
- 嵌入模型服务 / 重排序模型
- 图像生成模型
- 视频生成模型
详见预置模型列表。
API 端点类型
大模型服务平台(GenStudio)提供以下 API 接口:
- OpenAI 兼容接口
- 默认 Chat Completions 接口
- M×N Chat Completions 接口,可指定不同厂商芯片,仅支持语言模型/视觉模型
- Embeddings 接口
- Anthropic 兼容的 Messages 接口,可用于接入 Claude Code
- 与主流厂商兼容的 Rerank 接口
- 闭源视频生成/视频生成模型采用与原厂一致的 API 端点,具体细节请点击 GenStudio 模型卡片,查看相关细节。
注意
GenStudio 预置大语言模型支持在线聊天体验和多模型效果对比(不支持保存会话历史记录)。详见在线体验。
获取 GenStudio API 密钥
登录智算云平台,前往密钥管理页面,申请 API 密钥。
第三方工具集成
以常用工具为例,讲解如何快速接入 GenStudio API 服务工具。
Anthropic Claude Code
GenStudio 为部分模型提供了 Anthropic Messages 兼容接口,适用于使用 Anthropic 接口的工具,例如 Claude Code。在配置过程中,需要正确配置 API URL,API 密钥,和需要使用的模型。具体支持的模型,请以 GenStudio 模型广场「Claude 兼容」筛选结果为准。
MacOS / Linux:安装 Claude Code 后,手动修改 Claude Code 配置文件
~/.claude/settings.json。添加或替换YOUR_GENSTUDIO_API_KEY为您上一步获取到的 API 密钥。json{ "env": { "ANTHROPIC_AUTH_TOKEN": "YOUR_GENSTUDIO_API_KEY", "ANTHROPIC_BASE_URL": "https://cloud.infini-ai.com/maas", "API_TIMEOUT_MS": "3000000", "CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": 1, "ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-4.6", "ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-4.6", "ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-4.6" } }Windows:安装 Claude Code 后,在 CMD 中运行以下命令。添加或替换
YOUR_GENSTUDIO_API_KEY为您上一步获取到的 API 密钥。shellsetx ANTHROPIC_AUTH_TOKEN YOUR_GENSTUDIO_API_KEY setx ANTHROPIC_BASE_URL https://cloud.infini-ai.com/maas setx CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC 1 setx ANTHROPIC_DEFAULT_HAIKU_MODEL glm-4.6 setx ANTHROPIC_DEFAULT_SONNET_MODEL glm-4.6 setx ANTHROPIC_DEFAULT_OPUS_MODEL glm-4.6
其他环境变量说明:
ANTHROPIC_BASE_URL为 GenStudio Anthropic Messages 兼容接口地址ANTHROPIC_DEFAULT_HAIKU_MODEL:任何支持 Messages 接口的 GenStudio 预置模型ANTHROPIC_DEFAULT_HAIKU_MODEL:任何支持 Messages 接口的 GenStudio 预置模型ANTHROPIC_DEFAULT_HAIKU_MODEL:任何支持 Messages 接口的 GenStudio 预置模型
注意
使用 claude -p 命令(无头模式)执行提示词时,有可能遇到 API 错误 400 失败:
claude -p fails with "tools.3.custom.input_examples: Extra inputs are not permitted
可尝试降级到 claude code 2.0.36 或者设置环境变量 CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS=1。详见 Claude Code issue 11678
使用 OpenAI 兼容接口的工具
主流的 AI 工具均支持通过 OpenAI 兼容的 Chat Completions 接口接入 GenStudio 预置模型 API 服务。在配置过程中,需要正确配置 API URL,API 密钥,和需要使用的模型。本文不做赘述,可参考各工具使用文档或网络教程。
代码集成
API 接入教程
API 参考文档
GenStudio 提供基于 OpenAPI 规范文档,详细描述了 API Server、路径、请求体、响应体等。支持导出。
常见问题
大模型服务平台提供哪些模型?
大模型服务平台(GenStudio)集成并维护了来自主流厂商的模型服务,称为预置模型。您可以通过模型广场页面顶部切换到不同的分类,包括但不限于:
- 大语言模型
- 生图大模型
- 视频大模型
- 向量模型
- 重排序模型
- 多模型模型
- 语音大模型
预置模型会不定期更新,文档中未列出具体的模型列表。请移步 GenStudio 模型广场查看。
如何查看模型的上下文长度、最大生成长度?如何查找长文本模型?
文档中未列出具体的模型列表,您需要前往 GenStudio 模型广场查看。模型广场的每个模型卡片(和模型详情页)会显示模型适合的任务类型(如文本生成、代码生成、深度推理、工具调用等)、上下文长度、最大生成长度等关键信息。
如何找到详细的 GenStudio API 文档?
大模型服务平台(GenStudio)提供基于 OpenAPI 规范的 API 参考文档。
我可以在 GenStudio 部署自己的模型吗?
可以,您可以将微调后的模型通过大模型服务平台(GenStudio)部署到独占实例,并通过私有 API 服务访问。这些部署会有一个以"mif-"为前缀的唯一部署 ID。
该服务目前仅面向企业客户开放。