浏览模型
大模型服务平台(GenStudio)预置了来源于诸多厂商的主流系列模型,您可以了解、挑选模型,并进行体验。
筛选模型
模型广场页面集中展示大模型服务平台(GenStudio)预置的模型。模型广场顶部为模型筛选区,支持从模型类型、任务场景、支持芯片等维度复选标签,筛选模型。
每个预置大模型均以卡片的形式呈现,模型卡片携带以下信息:
模型名称:通常以“模型名字-参数规模”的基本结构进行命名,一般与模型厂商命名保持一致。根据模型所适配的任务类型场景和特性,可能带有如下后缀:
-chat
:对话类模型,例如qwen-7b-chat
。注意,chatglm3-6b-32k
例外,这是一个长文本对话模型。-base
:基础模型,例如chatglm3-6b-base
。-256k
:可处理的上下文 Token 量,例如chatglm3-6b-32k
。
NOTE
如果未标注为 chat/base 类模型,一般为基础模型。
模型标签:模型名称下方带有标签,可用于筛选模型。标签包含以下几类:
- 模型类型:模型的所属类型,如大语言模型(LLM)。
- 任务场景:模型支持的典型任务场景,如文本生成,代码生成等。
- 芯片类型:模型在当前平台可使用的芯片类型,如英伟达、AMD等。
模型简介:包括模型的来源,大小可适用场景等基本信息。
上线时间:为模型在平台上的首次上新/更新时间,包含年月日信息。
服务范围:卡片右下角,表示该模型在平台内支持的服务。
- 可体验:可在体验中心配置参数,进行互动体验。
- 可微调:支持 GenStudio 微调服务。详见模型微调
模型详情
当您点击模型卡片的任意位置,即可进入该模型的详情页。每个模型详情页面包含以下标签页:
- 模型详情:包含模型介绍、模型效果数据等。
- 调用说明:包含计费和结算方式、API 使用引导等。
NOTE
点击右上角的立即体验按钮,可直接前往体验中心,从 UI 界面与当前模型对话交互,体验该模型的效果,详情可查看体验中心。
查看详细介绍
模型详情标签页主要列出了模型在常见主流数据集上的表现,数据来自于模型发布方。
API 调用说明
调用说明标签页列出了通过 API 使用该预置大模型推理服务的基础信息。具体如下:
- 费用与用量:推理调用费用、计费方式、结算周期和用量统计入口
- 密钥获取方式:获取鉴权凭证的方式,可点击跳转至密钥管理页面。
- 调用方式示例:调用对话接口的代码示例,支持一键复制。
有关 API 的详细说明,参见 GenStudio API 参考。