上传文本模型资产
GenStudio 支持将用户上传本地模型文件,用于部署为在线服务。
提示
本功能仅向授权客户开放。非授权客户暂无法使用。如需使用,请联系商务或售后服务。
可上传的文本模型资产
- 上传基础模型适用于部署大语言模型。
- 单个模型资产的总文件大小不可超过 150GiB。
文件要求
GenStudio 将对上传的模型资产进行校验,如果缺少必要文件,将无法成功导入为可部署的模型。
请参考以下模型资产文件结构,基础模型文件结构也可参考 魔搭社区:Qwen2-7B-Instruct:
# 基模型
├── config.json # 必须
├── generation_config.json # 可选
├── model-00001-of-00002.safetensors # 必须
├── model-00002-of-00002.safetensors # 必须
├── model.safetensors.index.json # 可选
├── special_tokens_map.json # 可选
├── tokenizer_config.json # 必须
├── tokenizer.json # 必须
├── tokenizer.model # 必须Step 0 创建模型信息
在这一步中,我们需要先创建一条模型资产记录,并提供必要信息。这一步完成后,您可以获取上传方式和凭证,可将模型从本地上传至智算云平台的存储中。
前往 控制台 > 模型管理,点击创建我的模型。
在模型配置区域,完成以下配置:
- 模型类型:暂仅支持大语言模型
- 模型文件类型:选择基础模型 或 LoRA 权重
注意
部分功能选项仅向授权客户开放。非授权客户暂无法使用。如需使用,请联系商务或售后服务。
- 模型格式:固定为 HuggingFace,可点击查看示例
- 模型系列:从平台当前支持的模型系列中选择。例如,您需要上传的模型是基于
qwen2-7b-instruct进行 SFT 微调的模型,则应选择qwen2-7b-instruct。
在存储配置区域,完成以下配置:
可用区:选择一个目标可用区,用于存储上传的模型。部署该模型时,必须使用同一可用区的算力资源。
存储:固定值 50GiB。
共享高性能存储:集群可以 hostpath 方式挂载租户购买的同一可用区内的共享高性能存储,请依次选择文件系统、存储卷、挂载权限。如未购买高性能存储,无需修改。详见共享高性能存储。配置示例:
存储类型 文件系统名称 存储卷名称与 ID 高性能存储-性能型 广东B-默认高性能存储 /public (vo-c7kcjqv2tjs5llry)
填写基本信息
- 填写部署名称和描述。提交后,系统自动生成上传信息。
Step 1 上传模型
创建成功后,回到「模型管理」页面,可查看新建的模型资产记录。此时,模型的「导入状态」为待上传。

点击右侧上传,弹出上传信息页面,。您可以复制 scp/sftp 命令行,或通过 FileZilla 客户端上传模型资产。弹窗中已附有一次性的登录凭证。

如果模型较大,可能传输时间较长,请耐心等待。
警告
在本地上传结束后,必须点击弹窗中的已完成上传,开始导入,否则平台无法识别上传进度。
Step 2 导入模型
如果上传成功,模型状态将变为待导入。点击「已完成上传,开始导入」按钮,即可开始导入模型,模型状态将变更导入中。如果模型导入成功,状态将变为已导入。

注意
模型导入为耗时步骤,最长可能需要一天左右。
后续步骤
导入成功的模型用于部署。在「模型服务」页面,点击创建模型服务,即可部署为在线服务。详细操作请参见部署模型服务。
常见问题
为什么无法上传模型资产?
模型管理功能仅向授权客户开放。非授权客户暂无法使用。如需使用,请联系商务或售后服务。
为什么上传模型资产提示权限不足?
如果您当前使用账号并非超级管理员,您可能会遇到权限不足的提示。上传模型资产要求当前用户账号至少有大模型平台开发者权限,或已用户已关联的自定义策略允许该功能。如遇到权限不足问题,请联系租户的超级管理员。详见用户账号与权限策略。