API 用量统计
用量统计页面用于查看 GenStudio API 调用数据。通过该页面可以按模型类型、用户账号、API Key、调用模型和时间范围筛选请求量、失败数、Token 用量和调用分布。
页面数据通常会在实际发起 API 调用后约 10 分钟更新。体验中心网页端调用不计入 API 用量统计。
提示
用量统计页面的数据可见范围由当前登录用户身份决定。超级管理员可查看当前租户下所有用户的调用数据;非超级管理员仅能查看自己账号或有权限访问的用户数据。
选择模型类型
页面顶部提供 大语言模型、视频大模型 和 图片大模型 三个页签。先选择模型类型,再查看对应的调用指标。
- 大语言模型:查看调用模型总数、调用服务总次数、失败数、总 Token 数、输入 Token 数、输出 Token 数和输入缓存 Token 数。
- 视频大模型:查看调用模型总数、调用服务总次数、内容拦截调用次数、请求量趋势、用户调用分布和模型服务调用分布。
- 图片大模型:查看调用模型总数、调用服务总次数、请求量趋势、用户调用分布和模型服务调用分布。
筛选调用数据
先用筛选条件缩小范围,再判断调用趋势、失败来源或 Token 消耗是否符合预期。
- 用户账号:按调用用户筛选。非超级管理员通常只能查看自己账号或有权限访问的用户数据。
- API Key:按具体 API Key 筛选,适合排查某个应用、工具或 Coding Plan 相关密钥的调用量。
- 调用模型:在视频大模型和图片大模型页签中,可按具体模型筛选。
- 统计周期:大语言模型页签支持今日、昨日、本周、本月、上月等快捷周期;视频大模型和图片大模型页签支持近 1 天、近 3 天、近 7 天等快捷周期。
筛选后点击查询刷新统计结果。如需重新选择筛选条件,点击重置。
查看大语言模型用量
在大语言模型页签中,重点查看以下指标:
- 调用模型总数:当前筛选条件下产生调用的模型数量。
- 调用服务总次数:API 请求总次数。
- 失败数:请求失败次数。
- 调用 Token 总数:输入 Token 与输出 Token 的合计。
- 输入 Token 总数:请求输入消耗的 Token 数。
- 输出 Token 总数:模型响应消耗的 Token 数。
页面下方的模型列表按模型展示调用服务次数、失败数、失败率、总 Token 数、输入 Token 数、输出 Token 数和输入缓存 Token 数。需要离线分析时,点击导出下载当前统计结果。
查看图片和视频用量
在视频大模型和图片大模型页签中,重点查看请求量和调用分布。
- 调用模型总数:当前筛选条件下产生调用的模型数量。
- 调用服务总次数:API 请求总次数。
- 内容拦截调用次数:视频大模型页签中展示,用于判断内容安全拦截情况。
- 用量趋势图:查看请求量随时间变化的趋势。
- 用户调用分布:查看不同用户的请求量占比。
- 模型服务调用分布:查看不同模型的请求量占比。
如果某个模型或用户的请求量异常升高,先缩小时间范围和 API Key,再结合业务日志定位调用来源。
排查统计延迟和权限问题
如果页面没有显示预期数据,按以下顺序检查:
- 确认请求是通过 API Key 调用产生,不是通过体验中心网页端产生。
- 等待约 10 分钟后再次查询。
- 检查当前账号是否有权限查看目标用户的数据。
- 检查筛选条件中的 API Key、调用模型和统计周期是否覆盖目标请求。
- 如果仍无法定位请求,记录请求时间、模型 ID、API Key、响应体
id和响应头traceresponse,再按请求标识与排查整理信息。
常见问题
以下问题保留常见搜索问法。需要操作时,以前文的筛选和排查步骤为准。
为什么看不到刚刚发起的 API 调用?
用量统计不是实时数据,通常会在实际发起 API 调用后约 10 分钟更新。先确认请求是通过 API Key 调用产生,再检查 API Key、调用模型和统计周期是否覆盖目标请求。
为什么不能查看全部用户的调用情况?
数据可见范围由当前登录用户身份决定。超级管理员可查看当前租户下所有用户的调用数据;非超级管理员仅能查看自己账号或有权限访问的用户数据。如需查看全部用户,请联系超级管理员调整权限。
如何查看某个 API Key 或模型的用量?
在筛选区选择目标 API Key。如果页面提供调用模型筛选,再选择目标模型。查看某个模型的专属调用数据时,也可以从模型广场进入目标模型后查看调用详情。
如何导出用量统计数据?
在大语言模型页签中,设置好筛选条件后,点击模型列表上方的导出,即可下载当前筛选范围内的统计结果。
查看费用和限制
用量统计页面展示 API 调用数据,不展示具体费用。排查成本或限频问题时,继续查看以下文档: