概述
模型拼接作为业务集市数据加工的重要能力,旨在让用户在进行数据分析和数据可视化之前,能够对业务模型进行易于操作、低门槛、高效的数据处理。通过转换、合并等数据处理操作后,为终端业务人员提供更友好的业务模型。
模型拼接简介
模型拼接(JOIN)用来连接不同的业务数据模型。在数据分析时,当需要分析的数据存储在不同的模型,您可以通过模型拼接,把多个表连接起来,形成新的模型进行数据分析。更好的发现数据之间的关系,从而更好地理解数据。
目前模型拼接仅支持分析模型的结果表(查看业务模型),自定义查询,数据表这种标准二维表的拼接。
应用场景
在做模型拼接的应用场景,可以归类为三种:左合并、交集合并跟并集合并。
拼接方式 | 拼接描述 |
---|---|
左合并 | 左源表的数据全部显示,右源表只会显示符合关联条件的数据,右源表数据不足的地方补空。 |
交集合并 | 公共维度的值,在左右源表中都匹配的行会出现在结果中;对应 SQL 语句中的 inner join |
并集合并 | 将所选源表的数据全部显示,每个表中不符合关联条件的数据对应补空;对应 SQL 语句中的 full join |
操作步骤
选择业务模型,拖入到拼接画布中,画布背景区域会有高亮提示,按照提示放置即可。
当放入第二张表时,会自动弹出合并设置的抽屉。按照图中步骤操作,即可完成合并设置。
配置完成后,可以单击关联图标查看关联关系。
如果不需要某个节点,可以鼠标悬停在表上,单击删除该表。
自定义拼接条件
当需要自定义计算作为关联字段时,按照如下步骤操作:
- 在下拉中选择“创建计算字段”
- 输入表达式完成创建
关联前过滤
关联前需要做一些数据处理比如过滤掉一些行后,再进行拼接合并,可以按照下面步骤操作
多个公共维度关联
多个合并依据的意义即保证左右合并时数据的唯一性。比如如下两张表的拼接,就需要两个公共维度:城市,年份。
城市 | 年份 | 收入 |
---|---|---|
北京 | 2021 | 1300 |
北京 | 2022 | 1590 |
城市 | 年份 | 支出 |
---|---|---|
北京 | 2021 | 1525 |
北京 | 2022 | 1630 |
数据预览
用户可以点击通过数据预览,来观测拼接结果是否符合预期。
批量编辑拼接结果
用户可以对拼接结果字段显示名称可以进行编辑,对于不需要的可以进行删除操作,如下图。
常见问题
1、null值会互相匹配吗?
左右合并的两张表合并依据中如果有 null 值,null 之间不会互相匹配。
2、来源表的计算列,在结果表中是什么含义?
拼接结果中如果包含了来源表的计算列:相当于帮助用户在结果表上快捷的创建了一个计算字段(计算逻辑来自底表),是拼接后再进行计算的。
3、数据膨胀允许拼接吗?
在拼接计算时,如果发生了笛卡尔积后,会导致数据膨胀,这时系统会提示用户膨胀发生的部分维度值,协助去解决膨胀问题。
4、拼接结果是一个实体表吗?
拼接结果是一个逻辑表,每次查询都会按照拼接的定义进行Join计算。