自部署服务概述

GenStudio 的定制模型服务提供从自有/微调模型资产管理、在线推理服务部署与扩缩、监控与日志，到后续微调迭代的完整闭环，帮助您快速将模型能力安全、稳定地集成到生产级应用。

信息

支持将您上传的文本类模型资产（权重 / tokenizer / config 等）或微调产出模型部署为在线服务。
现阶段仅支持部署到独占实例；计费按照实际占用的算力规格与运行时长（分钟）计算。
若计划部署自训练或外部导入的模型，请先完成“上传文本模型资产”，再创建部署。

提示

本功能仅向授权客户开放。非授权客户暂无法使用。如需使用，请联系商务或售后服务。

服务总览

自部署服务：将上传或微调产出的模型一键部署为在线推理服务，生成独立的部署 ID 与 OpenAI 兼容 API 端点，支持启动/停止、监控与日志。
模型管理：上传并导入自有文本模型资产（基础模型或 LoRA 权重），校验必要文件结构后生成可引用的资产版本，供部署或迭代使用。

核心能力

支持部署自定义模型，可上传文本模型资产。
基于预置基础模型，在网页端发起微调。
将上传或微调产出的模型一键部署为在线推理服务。
获取推理接口地址与鉴权方式，接入业务侧，进行验证与集成。
监控推理服务日志，观测服务监控状态与模型性能。