在可视化组件的数据配置区中,除了对字段解析区的字段进行维度指标的组合,也可进行字段本身数据处理与加工,主要包含以下方式:
聚合方式
聚合是指在可视化组件的配置中,对维度列或指标列的聚合方式进行更改,具体在配置过程中有三种类型,分别如下:
数值聚合计算
当选中字段为数值类型时,统计方式默认为“求和”计算,可通过自定义计算列的形式进行更改,可以更改的包括求和,平均值,计数,去重计数,最大值,最小值,中位数,标准差,方差以及占比,如下图所示:
序号 | 名称 | 释义 |
---|---|---|
1 | 求和 | 求和聚合计算方式,返回该字段中所有值的总计,忽略 Null 值 |
2 | 平均值 | 平均聚合计算方式,返回该字段中所有值的平均值,忽略 Null 值 |
3 | 计数 | 计数聚合计算方式,返回组中的记录行数,不对 Null 值计数 |
4 | 去重计数 | 去重计数聚合计算方式,返回组中的删除重复记录的行数,不对 Null 值计数 |
5 | 最大值 | 最大值聚合计算方式,返回该字段中所有记录中的最大值 |
6 | 最小值 | 最小值聚合计算方式,返回该字段中所有记录中的最小值 |
7 | 中位数 | 中位数聚合计算方式,返回该字段中所有记录中的中位数,忽略 Null 值 |
8 | 标准差 | 对整个群体返回该字段中所有值的统计标准差 |
9 | 方差 | 对整个群体返回给该字段中所有值的统计方差 |
10 | 占比 | 返回该字段中每个值在当前计算方式下的占所有值的百分比,忽略Null 值,例如求和占比,计数占比 |
名称 | 释义 | |
---|---|---|
1 | 汇总占比 | 分母按当前指标聚合方式计算 计算方式:当前指标值/整列以当前指标聚合方式计算出的值 |
2 | 总和占比 | 分母按「求总和」方式计算 计算方式:当前指标值/整列以总和聚合方式计算出来的值 当字段聚合方式设置为「求和」时,汇总占比=总和占比 |
3 | 同环比 |
|
4 | 累计计算 | 为对该指标所有值逐行累计的统计结果,具体可参考:累计计算 |
汇总占比与中和占比计算方式参考下图:
- 2012年,“amount2(最大值 - 汇总占比)”=7/256,分母=整列最大值
- 2012年,“amount2(最大值 - 总和占比)”=7/1024,分母=整列总和值
以上可选择多种计算方式的可视化组件仅限当业务模型为“自定义查询,数据表,分析模型-结果表”的模型才会显示,当用户的业务模型选择“事件分析,session分析”等已携带聚合函数分析模型进行配置时,为了保留分析模型本身的语义则不可切换聚合函数。
文本聚合计算
当选中字段为非数值类型时,比如日期,文本类型、并期望作为指标统计,那么聚合方式默认为“计数”,可更改为去重计数。如下图所示:
序号 | 名称 | 释义 |
---|---|---|
1 | 计数 | 计数聚合计算方式,返回组中的记录行数,不对 Null 值计数 例如统计有销售额的商品sku有哪些 |
2 | 去重计数 | 去重计数聚合计算方式,返回组中的删除重复记录的行数,不对 Null 值计数 |
使用文本聚合计算时,也可选择高级计算,默认高级计算是无,可选择占比与累计计算,同环比,占比,具体如下:
序号 | 名称 | 释义 |
---|---|---|
1 | 占比 | 返回该字段中每个值在所有值的计数占比 |
2 | 同环比 |
|
3 | 累计计算 | 为对该指标所有值逐行累计的统计结果,具体可参考:累计计算 |
日期聚合类型
当日期字段作为维度使用时,根据存储结构的不同,部分业务模型可更改日期的聚合方式。聚合结果不仅与此配置相关,还取决于数据本身的存储粒度
- 天:默认格式为年-月-日(星期),例如 2023-08-28(一)
- 周:按周聚合,支持自定义每周的起点,默认格式为年-月-日(每周起始是星期N),例如 2023-08-28(一)
- 月:按月聚合,默认格式为年-月,例如2023-08
- 季度:按季度聚合,默认格式为年-季度,例如2023-Q3
- 年:按年聚合,默认格式为年,例如2023
- 小时:按小时聚合,默认格式为月-日 小时:分钟,例如08-28 10:00
- 分钟:按分钟聚合,默认格式为月-日 小时:分钟,例如08-28 10:58
在按周聚合的方式下,对于跨年的周场景,处理方式为:每周都是7天,年尾依据当年的日期推,推到这一周满7天为止
例如:如果设置「周一到周日」为一周,则2022年的第52周=2022-12-26 至 2023-01-01,从2023年1月2(周一)开始,算做2023年的第一周
格式转换
为用户方便控制图表上时间与度量的显示方式,包括日期,数值等数据格式均可支持自定义修改
日期格式
- 选择“数据显示格式”,进入格式化配置弹窗,共分两种显示方式,分别是
- 自动:默认日期格式,按业务模型存储格式的原始态进行显示
- 其他:自定义日期展示,日期格式支持“MM/dd/yyyy”,“MM/dd/yyyy hh:mm:ss”等17种日期格式的展示,可参考下图:
数值格式
- 按原始格式显示:数值格式的默认样式按业务模型存储格式的原始态进行显示,默认带千位分隔符
- 按数值格式显示:小数点后保留位默认显示 2 位,可支持到 10 位,数据量级默认选择无,支持无、万、百万、千万、亿、K、M
- 按百分比格式展示:默认两位小数,可支持10位小数位,如下图:
数据筛选
数据筛选用以过滤当前可视化组件的数据范围,点击添加筛选条件来添加已拖入数据配置区(什么是数据配置区?参考制作可视化组件)字段的筛选规则,多个筛选条件可以设置“且”“或”的交并关系
数据筛选便于对整个分析结果做过滤,使得满足限制特定范围下的分析,让分析过程更加聚焦,例如仅筛选国家=新加坡,整个可视化组件的配置聚焦于新加坡这一个维值进行指标分析;
点击“添加筛选条件”,进入数据筛选抽屉页,点击添加筛选条件进行添加,如下图:
数据排序
可视化组件在查看数据时,可以按照维度与指标值做整体与分组排序,例如查看该公司的整体销售业绩排名,查看该公司全国各区域下的销售业绩排名,报表中的可视化组件支持两类排序方式:
维度排序
- 维度字段初始状态为「不排序」
- 在「维度」字段上设置排序方式时,可以选择按照维度自身,也可以按照已经绑定的指标字段,对当前维度的分组进行排序
- 支持对多个维度分别设置排序规则,依次排序
- 由于柱状图、堆叠柱图组件不支持每个簇状中的柱形按不同顺序排列,所以在按细分维度排序时,实际会以第一个分组中的数值进行排序
- 非时间类型的维度字段支持使用「自定义排序」功能,可进行维度值的「置顶」与「置底」,拖动目标字段值至指定位置,自定义维度值在图表中实际显示的顺序
指标排序
- 指标字段初始状态为「不排序」
- 依据指标的聚合计算结果数值,对所有维度(包含细分维度)依次进行排序
- 升序/降序只依据指标数值的聚合结果
- 组内升序/组内降序只作用在维度的分组内
设置字段显示名称
字段的显示名称默认为空;如需修改,可通过“设置显示名称”进行修改,增强信息的可读性
修改后,图表中字段相关的名称将更新为显示名称,
设置字段注释
可通过对字段添加注释信息,帮助查看者理解口径信息
在图表编辑页修改完成、保存后,在报表查看页进行预览