概述
模型拼接作为业务集市数据加工的重要能力,旨在让用户在进行数据分析和数据可视化之前,能够对业务模型进行易于操作、低门槛、高效的数据处理。通过转换、合并等数据处理操作后,为终端业务人员提供更友好的业务模型。
模型拼接简介
模型拼接(JOIN)用来连接不同的业务数据模型。在数据分析时,当需要分析的数据存储在不同的模型,您可以通过模型拼接,把多个表连接起来,形成新的模型进行数据分析。更好的发现数据之间的关系,从而更好地理解数据。
目前模型拼接仅支持分析模型的结果表(查看业务模型),自定义查询,数据表这种标准二维表的拼接。
应用场景
在做模型拼接的应用场景,可以归类为三种:左合并、交集合并跟并集合并。
拼接方式 |
拼接描述 |
左合并 |
左源表的数据全部显示,右源表只会显示符合关联条件的数据,右源表数据不足的地方补空。 |
交集合并 |
公共维度的值,在左右源表中都匹配的行会出现在结果中;对应 SQL 语句中的 inner join |
并集合并 |
将所选源表的数据全部显示,每个表中不符合关联条件的数据对应补空;对应 SQL 语句中的 full join |

操作步骤
选择业务模型,拖入到拼接画布中,画布背景区域会有高亮提示,按照提示放置即可。

当放入第二张表时,会自动弹出合并设置的抽屉。按照图中步骤操作,即可完成合并设置。

配置完成后,可以单击关联图标查看关联关系。

如果不需要某个节点,可以鼠标悬停在表上,单击删除该表。

自定义拼接条件
当需要自定义计算作为关联字段时,按照如下步骤操作:
- 在下拉中选择 创建计算字段
- 输入表达式完成创建

关联前过滤
关联前需要做一些数据处理比如过滤掉一些行后,再进行拼接合并,可以按照下面步骤操作

多个公共维度关联
多个合并依据的意义即保证左右合并时数据的唯一性。比如如下两张表的拼接,就需要两个公共维度:城市,年份。
城市 |
年份 |
收入 |
北京 |
2021 |
1300 |
北京 |
2022 |
1590 |
城市 |
年份 |
支出 |
北京 |
2021 |
1525 |
北京 |
2022 |
1630 |
数据预览
用户可以点击通过数据预览,来观测拼接结果是否符合预期。

批量编辑拼接结果
用户可以对拼接结果字段显示名称可以进行编辑,对于不需要的可以进行删除操作,如下图。

常见问题
- null 值会互相匹配吗?
- 左右合并的两张表合并依据中如果有 null 值,null 之间不会互相匹配。
- 来源表的计算列,在结果表中是什么含义?
- 拼接结果中如果包含了来源表的计算列:相当于帮助用户在结果表上快捷地创建了一个计算字段(计算逻辑来自底表),是拼接后再进行计算的。
- 数据膨胀允许拼接吗?
- 在拼接计算时,如果发生了笛卡尔积后,会导致数据膨胀,这时系统会提示用户膨胀发生的部分维度值,协助去解决膨胀问题。
- 拼接结果是一个实体表吗?
- 拼接结果是一个逻辑表,每次查询都会按照拼接的定义进行 Join 计算。