概述

模型拼接作为业务集市数据加工的重要能力,旨在让用户在进行数据分析和数据可视化之前,能够对业务模型进行易于操作、低门槛、高效的数据处理。通过转换、合并等数据处理操作后,为终端业务人员提供更友好的业务模型。

模型拼接简介

模型拼接(JOIN)用来连接不同的业务数据模型。在数据分析时,当需要分析的数据存储在不同的模型,您可以通过模型拼接,把多个表连接起来,形成新的模型进行数据分析。更好的发现数据之间的关系,从而更好地理解数据。

目前模型拼接仅支持分析模型的结果表(查看业务模型),自定义查询,数据表这种标准二维表的拼接。

应用场景

在做模型拼接的应用场景,可以归类为三种:左合并、交集合并跟并集合并。

拼接方式拼接描述
左合并左源表的数据全部显示,右源表只会显示符合关联条件的数据,右源表数据不足的地方补空。
交集合并公共维度的值,在左右源表中都匹配的行会出现在结果中;对应 SQL 语句中的 inner join
并集合并将所选源表的数据全部显示,每个表中不符合关联条件的数据对应补空;对应 SQL 语句中的 full join

操作步骤

选择业务模型,拖入到拼接画布中,画布背景区域会有高亮提示,按照提示放置即可。


当放入第二张表时,会自动弹出合并设置的抽屉。按照图中步骤操作,即可完成合并设置。

配置完成后,可以单击关联图标查看关联关系。

如果不需要某个节点,可以鼠标悬停在表上,单击删除该表。



自定义拼接条件

当需要自定义计算作为关联字段时,按照如下步骤操作:

  1. 在下拉中选择“创建计算字段”
  2. 输入表达式完成创建


关联前过滤

关联前需要做一些数据处理比如过滤掉一些行后,再进行拼接合并,可以按照下面步骤操作

多个公共维度关联

多个合并依据的意义即保证左右合并时数据的唯一性。比如如下两张表的拼接,就需要两个公共维度:城市,年份。

城市年份收入
北京20211300
北京20221590
城市年份支出
北京20211525
北京20221630

数据预览

用户可以点击通过数据预览,来观测拼接结果是否符合预期。

批量编辑拼接结果

用户可以对拼接结果字段显示名称可以进行编辑,对于不需要的可以进行删除操作,如下图。

常见问题

1、null值会互相匹配吗?

左右合并的两张表合并依据中如果有 null 值,null 之间不会互相匹配。

2、来源表的计算列,在结果表中是什么含义?

拼接结果中如果包含了来源表的计算列:相当于帮助用户在结果表上快捷的创建了一个计算字段(计算逻辑来自底表),是拼接后再进行计算的。

3、数据膨胀允许拼接吗?

在拼接计算时,如果发生了笛卡尔积后,会导致数据膨胀,这时系统会提示用户膨胀发生的部分维度值,协助去解决膨胀问题。

4、拼接结果是一个实体表吗?

拼接结果是一个逻辑表,每次查询都会按照拼接的定义进行Join计算。