概述
资源管理的功能是基于系统中的查询明细数据,按照不同维度进行聚合,通过一系列和系统使用情况、资源消耗情况相关的指标按时序、占比进行展示,旨在帮助系统管理员了解系统资源消耗分布、定位异常查询,并可以对不合理查询进行终止、诊断和优化
- 查询任务:基于查询任务的详情信息聚合成的一系列可观测性指标,并记录环境中由定时任务发起或者 用户主动发起查询的记录,具体指标如下:
- 统计维度:按任务一级分类、登录账号、项目名称查询数据;
- 指标:查询次数、查询人数、平均耗时、失败率、CPU开销、内存消耗量、文件扫描量、耗时分布等。
功能入口:点击顶部导航栏的 按钮即可进入资源管理页面。
权限
需要 查看资源管理 权限。
查询任务
查询任务统计
查询任务概况
该部分基于时间范围、筛选条件、统计维度圈定的查询数据,展示查询次数、查询人数、平均耗时以及失败率,旨在给使用者提供一个资源使用的预览。
- 当查询时间范围选择一天时,提供日环比和周同比,当鼠标悬停在日环比和周同比时,可显示具体对比的日期。
查询任务统计
该部分基于时间范围、筛选条件、统计维度圈定的查询数据,展示了任务统计类指标的趋势变化和占比分布。
- 默认的可观测指标为:查询次数,可以选择切换查询人数、平均耗时和失败率,鼠标悬停在指标上可查看指标的解释说明。
- 鼠标悬停在趋势图任意点位或者饼图的某部分,即可显示该时间点对应统计指标的实际值。
- 点击趋势图任意点位或者饼图的某部分,即可展开查询的明细数据,并可以导出该明细数据。
查询任务系统资源消耗统计
该部分基于时间范围、筛选条件、统计维度圈定的查询数据,展示了任务系统资源消耗统计类指标的趋势变化和占比分布。
- 默认的可观测指标为:CPU开销,可以选择切换内存消耗量、文件扫描量,鼠标悬停在指标上可查看指标的解释说明。
- 鼠标悬停在趋势图任意点位或者饼图的某部分,即可显示该时间点对应统计指标的实际值。
- 点击趋势图任意点位或者饼图的某部分,即可展开查询的明细数据,并可以导出该明细数据。
查询任务分布统计
该部分基于时间范围、筛选条件圈定的查询数据,展示了查询任务的耗时分布情况。
- 鼠标悬停在柱状图,即可显示该时间点对应统计指标的实际值。
- 点击柱状图,即可展开查询的明细数据,并可以导出该明细数据。
- 耗时分布刻度默认从小于30秒到大于600秒。
查询任务详情
查询任务详情是记录环境中由系统定时任务发起或用户主动发起的所有查询,包括 进行中 和 已完成 的查询。
- 点击列表表头的 问号 图标,查看列表字段的具体含义。
- 点击 导出明细:导出列表筛选条件后的所有内容。
- 点击单个查询任务的 查看:侧拉显示诊断报告的详细信息。
- 点击单个查询任务的 下载:下载诊断报告。
- 对于正在运行的任务,点击单个查询任务的 终止运行 按钮:终止正在运行的作业,此功能点SBP1.1仅对admin账号开放,SBP1.4受「终止运行」权限点控制,可以配置允许对所有人发起的查询进行终止,也可以配置仅允许对自己发起的查询进行终止。
使用场景
场景1:如何使用 扩展标签 分析查询任务?
对于用户反馈的“查询慢”,归因众多,很多时候是因为用户发起了不合理查询导致的。 扩展标签 是对查询任务的特殊标识,旨在帮助系统管理员在对慢查询进行归因分析时,可以关注到这些标签,帮助他们排查定位查询慢的原因,考虑对不合理配置进行优化。
如何使用 失败率 分析查询任务?
举例说明: 如下图所示,在一段时间内,查询作业呈规律性、高达 100% 失败率,点击折线图上异常点位,可以看出是同一个账号的后台任务,可以考虑该定时任务存在查询异常的情况,或存在无用的定时任务浪费系统资源情况,进而可以考虑对该查询进行优化或彻底删除;
场景3:有用户反应某个时段查询慢时,如何来排查异常的查询任务?
如果是当前时间,可能是运行中的某(几)个不合理大查询占用了较多系统资源,导致查询排队挤压,资源紧张。此时需要: 1)进入<查询任务详情页> - <进行中> tab页 2)综合 任务占比峰值 、任务耗时 指标终止异常的作业
如果是历史的时间: 1)进入「查询任务执行统计页」 2)选择一个时间段(时间段范围覆盖查询慢时间节点,比如前后7天) 3)筛选反馈慢的用户的登陆账号 4)查看该用户 平均耗时 指标在查询慢相应时间节点前后的变化趋势
分析原因: 1)若查询慢的时间节点前后折线图有明显的趋势变化,可以通过点击异常点展开作业明细,通过综合统计维度以及 任务耗时、CPU开销 、内存消耗量、速度评估、扩展标签 等指标,定位异常作业,考虑是否因当时系统资源紧张,或用户本身发起了不合理查询导致,同时考虑对异常作业进行配置的优化。 2)若查询慢的时间节点前后折线图无明显的趋势变化,则可以判定非查询作业原因导致的系统慢。