快速开始
大模型服务平台(GenStudio)实现了开通账号即可使用的服务体验,采用以 Token 用量计费的模式,并提供包括身份认证、服务鉴权、模型安全等全面的保障。欢迎试用。
体验中心
大模型服务平台(GenStudio)提供可基于 UI 交互的体验中心。可根据不同的模型类型,提供多种体验交互方式。
NOTE
当前已支持在网页端直接体验对话、生成图片、生成视频。
Step 0 获取账号
大模型服务平台(GenStudio)与一站式 AI 开发平台(AIStudio)同属于无问芯穹的智算云平台(Infini-Cloud),您可使用同一套账号,访问大模型服务平台。
获取账号后,您可直接通过绑定手机号登录,或使用账号密码方式登陆。
- 账号格式:用户名@租户名
- 密码:自行设置的密码、或由租户管理员为您分配的密码
Step 1 选择模型
前往智算云控制台的模型广场页面,浏览大模型服务平台(GenStudio)的预置的主流模型。
点击卡片进入模型详情页。
在模型详情页点击立即体验,即可进入开启交互体验界面。
Step 3 使用体验中心
体验中心页面分为互动体验区和配置区。支持切换大语言模型、生图大模型、视频大模型进行体验。
大语言模型对话体验
选择需要体验的大语言模型,修改模型配置参数。
通过点击停止生成来停止当前模型的持续输出。
NOTE
在非流式模式的状态下,提前停止模型生成,则将无法有生成的内容返回给您。
配置大语言模型参数
配置区域项目如下:
模型类型切换:支持大语言模型、生图大模型、视频大模型。
模型选择:下拉框中展开了所有可体验的模型。平台将会持续更新,丰富大模型的数量与类型。如果开启M*N体验,可多选模型(最多 4 个),同时体验。
模型交互参数配置:因模型系列的不同,可能会支持不同的可配置参数。
以大语言模型为例,主要的参数包括:
- Stream:指模型是否以流式返回回答的内容,默认开启,关闭时,将一次性返回此次生成的所有内容。
- Max_tokens:指模型输出的最大 Token 数量。模型输入与输出的 Token 数量将共享模型可处理的文本长度。
- Temperature:采样温度,控制输出的随机性。值越高,会使输出更加随机,更具创造性;值越低,会使输出更加集中和确定性。我们推荐您根据应用场景调整 top_p 或 temperature 参数,但不建议同时调整两个参数。
- Top_p:用于控制输出文本的随机性和多样性,取值越大,生成文本越丰富。我们推荐您根据应用场景调整 top_p 或 temperature 参数,但不建议同时调整两个参数。
NOTE
如果希望体验更多参数和配置,建议使用 GenStudio API。
当模型完成或被停止生成后,可根据模型的回答情况,点击重新生成按钮,对之前所生成的最新一轮反馈进行重新生成。对模型已经完成输出生成的内容,平台会统计本轮对话所产生的输入与输出 Token 总和。
TIP
整体体验受不同模型的上下文长度限制。点击新建对话,可清空当前对话内容,开始一个全新对话。
多模型多芯片体验
体验中心支持 M*N体验。开启后选择模型和该模型支持的芯片类型,最多选择 4 个模型,在右侧的交互体验区同时体验。
在M*N体验模式下,多个模型享受同样的输入和同时的请求,您可直观体验不同模型和不同芯片对于同样的指令的返回差异。因不同模型的参数规模、配置等差异,模型对于同一个指令的回答的内容、生成速度、篇幅都可能有差异。
TIP
当对比中的模型仍正在输出时,您无法进行新对话的发起或者输入下一轮的指令,当所有模型都完成内容返回时,则可以开启下一轮的对话对比。
调整单个模型配置
M*N体验模式下,多个模型不共享配置。您可以通过左侧的展开、收拢按钮来查看、调整指定模型的参数配置。
图像模型体验
切换到生图大模型,可体验 SD 模型的生图效果。暂仅支持随机选择预置提示词。
![NOTE] 由于监管要求,该模型仅面向企业或研究机构。符合条件的客户提交申请可体验。
视频模型体验
切换到视频大模型,可体验 cogvideox-2b
模型的视频生成效果。暂仅支持随机选择预置提示词。
![NOTE] 由于监管要求,该模型仅面向企业或研究机构。符合条件的客户提交申请可体验。