Skip to content

API 用量统计

用量统计页面用于查看 GenStudio API 调用数据。通过该页面可以按模型类型、用户账号、API Key、调用模型和时间范围筛选请求量、失败数、Token 用量和调用分布。

页面数据通常会在实际发起 API 调用后约 10 分钟更新。体验中心网页端调用不计入 API 用量统计。

提示

用量统计页面的数据可见范围由当前登录用户身份决定。超级管理员可查看当前租户下所有用户的调用数据;非超级管理员仅能查看自己账号或有权限访问的用户数据。

选择模型类型

页面顶部提供 大语言模型视频大模型图片大模型 三个页签。先选择模型类型,再查看对应的调用指标。

  • 大语言模型:查看调用模型总数、调用服务总次数、失败数、总 Token 数、输入 Token 数、输出 Token 数和输入缓存 Token 数。
  • 视频大模型:查看调用模型总数、调用服务总次数、内容拦截调用次数、请求量趋势、用户调用分布和模型服务调用分布。
  • 图片大模型:查看调用模型总数、调用服务总次数、请求量趋势、用户调用分布和模型服务调用分布。

筛选调用数据

先用筛选条件缩小范围,再判断调用趋势、失败来源或 Token 消耗是否符合预期。

  • 用户账号:按调用用户筛选。非超级管理员通常只能查看自己账号或有权限访问的用户数据。
  • API Key:按具体 API Key 筛选,适合排查某个应用、工具或 Coding Plan 相关密钥的调用量。
  • 调用模型:在视频大模型和图片大模型页签中,可按具体模型筛选。
  • 统计周期:大语言模型页签支持今日、昨日、本周、本月、上月等快捷周期;视频大模型和图片大模型页签支持近 1 天、近 3 天、近 7 天等快捷周期。

筛选后点击查询刷新统计结果。如需重新选择筛选条件,点击重置

查看大语言模型用量

大语言模型页签中,重点查看以下指标:

  • 调用模型总数:当前筛选条件下产生调用的模型数量。
  • 调用服务总次数:API 请求总次数。
  • 失败数:请求失败次数。
  • 调用 Token 总数:输入 Token 与输出 Token 的合计。
  • 输入 Token 总数:请求输入消耗的 Token 数。
  • 输出 Token 总数:模型响应消耗的 Token 数。

页面下方的模型列表按模型展示调用服务次数、失败数、失败率、总 Token 数、输入 Token 数、输出 Token 数和输入缓存 Token 数。需要离线分析时,点击导出下载当前统计结果。

查看图片和视频用量

视频大模型图片大模型页签中,重点查看请求量和调用分布。

  • 调用模型总数:当前筛选条件下产生调用的模型数量。
  • 调用服务总次数:API 请求总次数。
  • 内容拦截调用次数:视频大模型页签中展示,用于判断内容安全拦截情况。
  • 用量趋势图:查看请求量随时间变化的趋势。
  • 用户调用分布:查看不同用户的请求量占比。
  • 模型服务调用分布:查看不同模型的请求量占比。

如果某个模型或用户的请求量异常升高,先缩小时间范围和 API Key,再结合业务日志定位调用来源。

排查统计延迟和权限问题

如果页面没有显示预期数据,按以下顺序检查:

  1. 确认请求是通过 API Key 调用产生,不是通过体验中心网页端产生。
  2. 等待约 10 分钟后再次查询。
  3. 检查当前账号是否有权限查看目标用户的数据。
  4. 检查筛选条件中的 API Key、调用模型和统计周期是否覆盖目标请求。
  5. 如果仍无法定位请求,记录请求时间、模型 ID、API Key、响应体 id 和响应头 traceresponse,再按请求标识与排查整理信息。

常见问题

以下问题保留常见搜索问法。需要操作时,以前文的筛选和排查步骤为准。

为什么看不到刚刚发起的 API 调用?

用量统计不是实时数据,通常会在实际发起 API 调用后约 10 分钟更新。先确认请求是通过 API Key 调用产生,再检查 API Key、调用模型和统计周期是否覆盖目标请求。

为什么不能查看全部用户的调用情况?

数据可见范围由当前登录用户身份决定。超级管理员可查看当前租户下所有用户的调用数据;非超级管理员仅能查看自己账号或有权限访问的用户数据。如需查看全部用户,请联系超级管理员调整权限。

如何查看某个 API Key 或模型的用量?

在筛选区选择目标 API Key。如果页面提供调用模型筛选,再选择目标模型。查看某个模型的专属调用数据时,也可以从模型广场进入目标模型后查看调用详情

如何导出用量统计数据?

大语言模型页签中,设置好筛选条件后,点击模型列表上方的导出,即可下载当前筛选范围内的统计结果。

查看费用和限制

用量统计页面展示 API 调用数据,不展示具体费用。排查成本或限频问题时,继续查看以下文档: