自部署服务概述
GenStudio 的定制模型服务提供从自有/微调模型资产管理、在线推理服务部署与扩缩、监控与日志,到后续微调迭代的完整闭环,帮助您快速将模型能力安全、稳定地集成到生产级应用。
注意
- 支持将您上传的文本类模型资产(权重 / tokenizer / config 等)或微调产出模型部署为在线服务。
- 现阶段仅支持部署到独占实例;计费按照实际占用的算力规格与运行时长(分钟)计算。
- 若计划部署自训练或外部导入的模型,请先完成“上传文本模型资产”,再创建部署。
提示
本功能仅向授权客户开放。非授权客户暂无法使用。如需使用,请联系商务或售后服务。
服务总览
- 自部署服务:将上传或微调产出的模型一键部署为在线推理服务,生成独立的部署 ID 与 OpenAI 兼容 API 端点,支持启动/停止、监控与日志。
- 模型管理:上传并导入自有文本模型资产(基础模型或 LoRA 权重),校验必要文件结构后生成可引用的资产版本,供部署或迭代使用。
核心能力
- 支持部署自定义模型,可上传文本模型资产。
- 基于预置基础模型,在网页端发起微调。
- 将上传或微调产出的模型一键部署为在线推理服务。
- 获取推理接口地址与鉴权方式,接入业务侧,进行验证与集成。
- 监控推理服务日志,观测服务监控状态与模型性能。