GenStudio LLM API 部分模型价格调整公告GenStudio LLM API 部分模型价格调整公告 ,新价格 2025 年 11 月 1 日生效调价公告
Skip to content

上传文本模型资产

GenStudio 支持将用户上传本地模型文件,用于部署为在线服务。

提示

本功能仅向授权客户开放。非授权客户暂无法使用。如需使用,请联系商务或售后服务。

可上传的文本模型资产

  • 上传基础模型适用于部署大语言模型。
  • 单个模型资产的总文件大小不可超过 150GiB。

文件要求

GenStudio 将对上传的模型资产进行校验,如果缺少必要文件,将无法成功导入为可部署的模型。

请参考以下模型资产文件结构,基础模型文件结构也可参考 魔搭社区:Qwen2-7B-Instruct

# 基模型
├── config.json  # 必须 
├── generation_config.json  # 可选
├── model-00001-of-00002.safetensors  # 必须
├── model-00002-of-00002.safetensors  # 必须
├── model.safetensors.index.json  # 可选
├── special_tokens_map.json  # 可选
├── tokenizer_config.json  # 必须
├── tokenizer.json    # 必须
├── tokenizer.model   # 必须

Step 0 创建模型信息

在这一步中,我们需要先创建一条模型资产记录,并提供必要信息。这一步完成后,您可以获取上传方式和凭证,可将模型从本地上传至智算云平台的存储中。

  1. 前往 控制台 > 模型管理,点击创建我的模型

  2. 模型配置区域,完成以下配置:

    • 模型类型:暂仅支持大语言模型
    • 模型文件类型:选择基础模型LoRA 权重

      注意

      部分功能选项仅向授权客户开放。非授权客户暂无法使用。如需使用,请联系商务或售后服务。

    • 模型格式:固定为 HuggingFace,可点击查看示例
    • 模型系列:从平台当前支持的模型系列中选择。例如,您需要上传的模型是基于 qwen2-7b-instruct 进行 SFT 微调的模型,则应选择 qwen2-7b-instruct
  3. 存储配置区域,完成以下配置:

    • 可用区:选择一个目标可用区,用于存储上传的模型。部署该模型时,必须使用同一可用区的算力资源。

    • 存储:固定值 50GiB。

    • 共享高性能存储:集群可以 hostpath 方式挂载租户购买的同一可用区内的共享高性能存储,请依次选择文件系统、存储卷、挂载权限。如未购买高性能存储,无需修改。详见共享高性能存储。配置示例:

      存储类型文件系统名称存储卷名称与 ID
      高性能存储-性能型广东B-默认高性能存储/public (vo-c7kcjqv2tjs5llry)
  4. 填写基本信息

    • 填写部署名称和描述。提交后,系统自动生成上传信息。

Step 1 上传模型

创建成功后,回到「模型管理」页面,可查看新建的模型资产记录。此时,模型的「导入状态」为待上传

alt text

点击右侧上传,弹出上传信息页面,。您可以复制 scp/sftp 命令行,或通过 FileZilla 客户端上传模型资产。弹窗中已附有一次性的登录凭证。

alt text

如果模型较大,可能传输时间较长,请耐心等待。

警告

在本地上传结束后,必须点击弹窗中的已完成上传,开始导入,否则平台无法识别上传进度。

Step 2 导入模型

如果上传成功,模型状态将变为待导入。点击「已完成上传,开始导入」按钮,即可开始导入模型,模型状态将变更导入中。如果模型导入成功,状态将变为已导入

alt text

注意

模型导入为耗时步骤,最长可能需要一天左右。

后续步骤

导入成功的模型用于部署。在「模型服务」页面,点击创建模型服务,即可部署为在线服务。详细操作请参见部署模型服务

常见问题

为什么无法上传模型资产?

模型管理功能仅向授权客户开放。非授权客户暂无法使用。如需使用,请联系商务或售后服务。

为什么上传模型资产提示权限不足?

如果您当前使用账号并非超级管理员,您可能会遇到权限不足的提示。上传模型资产要求当前用户账号至少有大模型平台开发者权限,或已用户已关联的自定义策略允许该功能。如遇到权限不足问题,请联系租户的超级管理员。详见用户账号与权限策略