在可视化组件的数据配置区中,除了对字段解析区的字段进行维度指标的组合,也可进行字段本身数据处理与加工,主要包含以下方式:

1. 聚合方式

聚合是指在可视化组件的配置中,对维度列或指标列的聚合方式进行更改,具体在配置过程中有三种类型,分别如下:

1.1. 数值聚合计算

当选中字段为数值类型时,统计方式默认为“求和”计算,可通过自定义计算列的形式进行更改,可以更改的包括求和,平均值,计数,去重计数,最大值,最小值,中位数,标准差,方差以及占比,如下图所示:

序号名称释义
1求和求和聚合计算方式,返回该字段中所有值的总计,忽略 Null 值
2平均值平均聚合计算方式,返回该字段中所有值的平均值,忽略 Null 值
3计数计数聚合计算方式,返回组中的记录行数,不对 Null 值计数
4去重计数去重计数聚合计算方式,返回组中的删除重复记录的行数,不对 Null 值计数
5最大值最大值聚合计算方式,返回该字段中所有记录中的最大值
6最小值最小值聚合计算方式,返回该字段中所有记录中的最小值
7中位数中位数聚合计算方式,返回该字段中所有记录中的中位数,忽略 Null 值
8标准差对整个群体返回该字段中所有值的统计标准差
9方差对整个群体返回给该字段中所有值的统计方差
10占比返回该字段中每个值在当前计算方式下的占所有值的百分比,忽略Null 值,例如求和占比,计数占比


名称释义
1总和占比

分母按「求总和」方式计算

计算方式:当前指标值/整列以总和聚合方式计算出来的值

2累计占比

分母按当前指标聚合方式计算

计算方式:当前指标值/整列以当前指标聚合方式计算出的值

当字段聚合方式设置为「求和」时,汇总占比=总和占比

3同环比
  • 环比增长率=(本期数-上期数)/上期数×100%
  • 同比增长率=(本期数-同期数)/同期数×100%(支持周同比、月同比、年同比

以上可选择多种计算方式的可视化组件仅限当业务模型为“自定义查询,数据表,分析模型-结果表”的模型才会显示,当用户的业务模型选择“事件分析,session分析”等已携带聚合函数分析模型进行配置时,为了保留分析模型本身的语义则不可切换聚合函数。

1.2. 文本聚合计算

当选中字段为非数值类型时,比如日期,文本类型、并期望作为指标统计,那么聚合方式默认为“计数”,可更改为去重计数。如下图所示:

序号名称释义
1计数

计数聚合计算方式,返回组中的记录行数,不对 Null 值计数

例如统计有销售额的商品sku有哪些

2去重计数去重计数聚合计算方式,返回组中的删除重复记录的行数,不对 Null 值计数

使用文本聚合计算时,也可选择高级计算,默认高级计算是无,可选择占比与累计计算,同环比,占比,具体如下:

序号名称释义
1占比返回该字段中每个值在所有值的计数占比
2同环比
  • 环比增长率=(本期数-上期数)/上期数×100%
  • 同比增长率=(本期数-同期数)/同期数×100%(支持周同比、月同比、年同比

1.3. 日期聚合类型

当日期字段作为维度使用时,根据存储结构的不同,部分业务模型可更改日期的聚合方式。聚合结果不仅与此配置相关,还取决于数据本身的存储粒度

  • 天:默认格式为年-月-日(星期),例如 2023-08-28(一)
  • 周:按周聚合,支持自定义每周的起点,默认格式为年-月-日(每周起始是星期N),例如 2023-08-28(一)
  • 月:按月聚合,默认格式为年-月,例如2023-08
  • 季度:按季度聚合,默认格式为年-季度,例如2023-Q3
  • 年:按年聚合,默认格式为年,例如2023
  • 小时:按小时聚合,默认格式为月-日 小时:分钟,例如08-28 10:00
  • 分钟:按分钟聚合,默认格式为月-日 小时:分钟,例如08-28 10:58

在按周聚合的方式下,对于跨年的周场景,处理方式为:每周都是7天,年尾依据当年的日期推,推到这一周满7天为止

例如:如果设置「周一到周日」为一周,则2022年的第52周=2022-12-26 至 2023-01-01,从2023年1月2(周一)开始,算做2023年的第一周


2. 格式转换

为用户方便控制图表上时间与度量的显示方式,包括日期,数值等数据格式均可支持自定义修改

2.1. 日期格式

  • 选择“数据显示格式”,进入格式化配置弹窗,共分两种显示方式,分别是
    • 自动:默认日期格式,按业务模型存储格式的原始态进行显示
    • 其他:自定义日期展示,日期格式支持“MM/dd/yyyy”,“MM/dd/yyyy hh:mm:ss”等17种日期格式的展示,可参考下图:

2.2. 数值格式

  • 按原始格式显示:数值格式的默认样式按业务模型存储格式的原始态进行显示,默认带千位分隔符
  • 按数值格式显示:小数点后保留位默认显示 2 位,可支持到 10 位,数据量级默认选择无,支持无、万、百万、千万、亿、K、M
  • 按百分比格式展示:默认两位小数,可支持10位小数位,如下图:


3. 数据筛选

数据筛选配置项用以过滤当前可视化组件的数据范围,通过新增来配置所有字段的筛选规则,且这些筛选条件有“且”“或”的交并关系;

数据筛选便于对整个分析结果做二次过滤,使得分析过程更加聚焦,例如仅筛选国家=新加坡,整个可视化组件的配置聚焦于新加坡这一个国家进行分析;

点击“添加筛选条件”,进入数据筛选抽屉页,见下图:


4. 数据排序 

可视化组件在查看数据时,可以按照维度与指标值做整体与分组排序,例如查看该公司的整体销售业绩排名,查看该公司全国各区域下的销售业绩排名,报表中的可视化组件支持两类排序方式:

4.1. 维度排序

  • 维度字段初始状态为「不排序」
  • 在「维度」字段上设置排序方式时,可以选择按照维度自身,也可以按照已经绑定的指标字段,对当前维度的分组进行排序
  • 支持对多个维度分别设置排序规则,依次排序
  • 由于柱状图、堆叠柱图组件不支持每个簇状中的柱形按不同顺序排列,所以在按细分维度排序时,实际会以第一个分组中的数值进行排序
  • 非时间类型的维度字段支持使用「自定义排序」功能,可进行维度值的「置顶」与「置底」,拖动目标字段值至指定位置,自定义维度值在图表中实际显示的顺序


4.2. 指标排序

  • 指标字段初始状态为「不排序」
  • 依据指标的聚合计算结果数值,对所有维度(包含细分维度)依次进行排序
  • 升序/降序只依据指标数值的聚合结果
  • 组内升序/组内降序只作用在维度的分组内


5. 设置字段显示名称

字段的显示名称默认为空;如需修改,可通过“设置显示名称”进行修改,增强信息的可读性

修改后,图表中字段相关的名称将更新为显示名称,

6. 设置字段注释

可通过对字段添加注释信息,帮助查看者理解口径信息

在图表编辑页修改完成、保存后,在报表查看页进行预览