概述
资源管理是基于系统负载管理升级迭代的,其功能一方面是基于系统中的查询明细数据,按照不同维度进行聚合,通过一系列和系统使用情况、资源消耗情况相关的指标按时序、占比进行展示,旨在帮助系统管理员了解系统资源消耗分布,定位异常查询,并可以对不合理查询进行终止、诊断和优化;另一方面通过产品化的数据支撑,帮助管理员从全局视角了解神策系统的业务资源构成情况以及业务资源的使用情况,为客户降本增效提供数据洞察和动作指引。
查询任务:该部分是基于查询任务的详情信息聚合成的一系列可观测性指标,并记录环境中由定时任务发起或者用户主动发起查询的记录,具体指标如下:
- 统计维度:按任务一级分类、按登录账号、按项目名称查看查询数据
- 指标:查询次数、查询人数、平均耗时、失败率、CPU 开销、内存消耗量、文件扫描量、耗时分布
业务资源:该部分从全局视角提供表数据、标签、分群、概览、书签等多项数据资源的统计和盘点,直观展示神策系统的业务资源构成情况以及业务资源的使用情况,具体指标如下:
- 元事件:近 30 天入库、近 30 天被引用次数、接收状态、显示状态
- 事件属性:近 30 天被引用次数、显示状态
- 用户属性:近 30 天被引用次数、显示状态
- 分群:近 30 天查询次数、近 30 天被引用次数、更新方式
- 标签:近 30 天查询次数、近 30 天被引用次数、更新方式
- 概览:近 30 天查询次数、近 30 天 PV、更新状态
- 书签:近 30 天查询次数、近 30 天 PV
入口 & 权限
入口:点击导航右上角的资源管理按钮进入产品界面。

权限:
受权限点 查看资源管理 控制。预制角色:管理员默认可以查看资源管理;其他角色默认不可以查看资源管理。
查询任务
查询任务统计
查询任务概况
该部分基于时间范围、筛选条件、统计维度,展示圈定的查询任务的关键指标,包括查询成功次数、查询失败次数、已终止次数、排队中次数、计算中次数、查询人数、查询平均耗时,旨在给使用者提供一个查询任务整体概况。
同时,除查询人数、查询平均耗时外,点击其余指标,可跳转至 查询任务详情 页,并自动填充该指标自带的筛选条件。
当查询时间范围选择一天时,提供日环比和周同比,当鼠标悬停在日环比和周同比时,可显示具体对比的日期。

查询任务统计
该部分基于时间范围、筛选条件、统计维度圈定的查询数据,展示了任务统计类指标的趋势变化和占比分布。

- 默认的可观测指标为:查询次数,可以选择切换查询人数、平均耗时和失败率,鼠标悬停在指标上可查看指标的解释说明。
- 鼠标悬停在趋势图任意点位或者饼图的某部分,即可显示该时间点对应统计指标的实际值。
- 点击趋势图任意点位或者饼图的某部分,即可展开查询的明细数据,并可以导出该明细数据。
查询任务系统资源消耗统计
该部分基于时间范围、筛选条件、统计维度圈定的查询数据,展示了任务系统资源消耗统计类指标的趋势变化和占比分布。

- 默认的可观测指标为:CPU 开销,可以选择切换内存消耗量、文件扫描量,鼠标悬停在指标上可查看指标的解释说明。
- 鼠标悬停在趋势图任意点位或者饼图的某部分,即可显示该时间点对应统计指标的实际值。
- 点击趋势图任意点位或者饼图的某部分,即可展开查询的明细数据,并可以导出该明细数据。
查询任务分布统计
该部分基于时间范围、筛选条件圈定的查询数据,展示了查询任务的耗时分布情况。

- 鼠标悬停在柱状图,即可显示该时间点对应统计指标的实际值。
- 点击柱状图,即可展开查询的明细数据,并可以导出该明细数据。
- 耗时分布刻度默认从小于 30 秒到大于 600 秒。
查询任务详情
查询任务详情是记录环境中由系统定时任务发起或用户主动发起的所有查询,包括 进行中 和 已完成 的查询。

- 点击列表表头的 问号 图标,查看列表字段的具体含义。
- 点击 导出明细 :导出列表筛选条件后的所有内容。
- 点击单个查询任务的 查看 :侧拉显示诊断报告的详细信息。
- 点击单个查询任务的 下载 :下载诊断报告。
- 对于正在运行的任务,点击单个查询任务的 终止运行 按钮:终止正在运行的作业,此功能点 SBP 1.1 仅对 admin 账号开放,SBP 1.4 受 终止运行 权限点控制,可以配置允许对所有人发起的查询进行终止,也可以配置仅允许对自己发起的查询进行终止。
使用场景
场景 1:如何使用「扩展标签」分析查询任务?
对于用户反馈的“查询慢”,归因众多,很多时候是因为用户发起了不合理查询导致的。 扩展标签 是对查询任务的特殊标识,旨在帮助系统管理员在对慢查询进行归因分析时,可以关注到这些标签,帮助他们排查定位查询慢的原因,考虑对不合理配置进行优化。

如何使用「失败率」分析查询任务?
举例说明:如下图所示,在一段时间内,查询作业呈规律性、高达 100% 失败率,点击折线图上异常点位,可以看出是同一个账号的后台任务,可以考虑该定时任务存在查询异常的情况,或存在无用的定时任务浪费系统资源情况,进而可以考虑对该查询进行优化或彻底删除。

场景 3:有用户反应某个时段查询慢时,如何来排查异常的查询任务?
如果是当前时间,可能是运行中的某(几)个不合理大查询占用了较多系统资源,导致查询排队挤压,资源紧张。此时需要:
- 进入 查询任务详情页 > 进行中 tab 页
- 综合 任务占比峰值 、 任务耗时 指标终止异常的作业

如果是历史的时间:
- 进入 查询任务执行统计页
- 选择一个时间段(时间段范围覆盖查询慢时间节点,比如前后 7 天)
- 筛选反馈慢的用户的登陆账号
- 查看该用户 平均耗时 指标在查询慢相应时间节点前后的变化趋势

分析原因:
- 若查询慢的时间节点前后折线图有明显的趋势变化,可以通过点击异常点展开作业明细,通过综合统计维度以及 任务耗时 、 CPU 开销 、 内存消耗量 、 速度评估 、 扩展标签 等指标,定位异常作业,考虑是否因当时系统资源紧张,或用户本身发起了不合理查询导致,同时考虑对异常作业进行配置的优化。
- 若查询慢的时间节点前后折线图无明显的趋势变化,则可以判定非查询作业原因导致的系统慢。
业务资源
业务资源部分分别统计了事件表、用户表、标签、分群、书签和概览的资源使用情况。
其中分群、标签需要开通相关 License,才能可见此部分统计数据。
概况区
该部分展示数据指标,用于帮助使用者判断每个项目下的每个业务资源是否需要进行资源优化和清理。

明细数据
该部分展示每个业务资源的详细数据,便于使用者进一步判断具体需要优化和清理的业务资源。

- 点击 导出明细 :导出列表筛选条件后的所有内容。
- 鼠标悬停在 问号 图标查看指标含义。
- 点击单个资源的 查看 :查看资源具体的查询或被引用的明细数据。
- 点击单个资源的 进入资源页 :进入具体的资源的详情页(仅用户分群、用户标签、概览类型的资源支持)。
标记删除
此功能需要满足版本为:SA 2.5.3+ & SBP 1.4.2+,同时仅概览、书签这两类资源拥有此功能,下面以概览为例:

- 点击单个资源的 标记删除 或者勾选多个资源后点击 批量标记删除 ,概览立即被移动至标记删除明细列表,预计彻底删除时间为进入标记删除列表后的第 30 天,同时概览在概览管理列表以及概览看板中前端不可见。

- 标记删除明细列表中,点击单个资源的 标记恢复 或者勾选多个资源后点击 批量标记恢复 ,概览重新回到到概览明细列表,同时概览在概览管理列表以及概览看板中的前端恢复可见。
调整数据统计范围
支持调整统计天数,包括:【查询任务】过去 N 天统计概况、业务资源过去 N 天被引用次数、业务资源过去 N 天查询次数,上限为 90 天。
例如将 30 天调整为 60 天,则配置后第二天开始,系统将会保留 1-31 天数据,每日保留直至上限达到 60 天。
请联系神策运维同学进行配置。
License
License 控制,开通 License 后方可使用。