Skip to content

浏览模型

大模型服务平台(GenStudio)预置了来源于诸多厂商的主流系列模型,您可以了解、挑选模型,并进行体验。

筛选模型

模型广场页面集中展示大模型服务平台(GenStudio)预置的模型。模型广场顶部为模型筛选区,支持从模型类型任务场景支持芯片等维度复选标签,筛选模型。

每个预置大模型均以卡片的形式呈现,模型卡片携带以下信息:

  • 模型名称:通常以“模型名字-参数规模”的基本结构进行命名,一般与模型厂商命名保持一致。根据模型所适配的任务类型场景和特性,可能带有如下后缀:

    • -chat:对话类模型,例如 qwen-7b-chat。注意,chatglm3-6b-32k 例外,这是一个长文本对话模型。
    • -base:基础模型,例如 chatglm3-6b-base
    • -256k:可处理的上下文 Token 量,例如 chatglm3-6b-32k

    NOTE

    如果未标注为 chat/base 类模型,一般为基础模型。

  • 模型标签:模型名称下方带有标签,可用于筛选模型。标签包含以下几类:

    • 模型类型:模型的所属类型,如大语言模型(LLM)。
    • 任务场景:模型支持的典型任务场景,如文本生成,代码生成等。
    • 芯片类型:模型在当前平台可使用的芯片类型,如英伟达、AMD等。
  • 模型简介:包括模型的来源,大小可适用场景等基本信息。

  • 上线时间:为模型在平台上的首次上新/更新时间,包含年月日信息。

  • 服务范围:卡片右下角,表示该模型在平台内支持的服务。

    • 可体验:可在体验中心配置参数,进行互动体验。
    • 可微调:支持 GenStudio 微调服务。详见模型微调

模型详情

当您点击模型卡片的任意位置,即可进入该模型的详情页。每个模型详情页面包含以下标签页:

  • 模型详情:包含模型介绍、模型效果数据等。
  • 调用说明:包含计费和结算方式、API 使用引导等。

NOTE

点击右上角的立即体验按钮,可直接前往体验中心,从 UI 界面与当前模型对话交互,体验该模型的效果,详情可查看体验中心

查看详细介绍

模型详情标签页主要列出了模型在常见主流数据集上的表现,数据来自于模型发布方。

API 调用说明

调用说明标签页列出了通过 API 使用该预置大模型推理服务的基础信息。具体如下:

  • 费用与用量:推理调用费用、计费方式、结算周期和用量统计入口
  • 密钥获取方式:获取鉴权凭证的方式,可点击跳转至密钥管理页面。
  • 调用方式示例:调用对话接口的代码示例,支持一键复制。

有关 API 的详细说明,参见 GenStudio API 参考