1. 视频版讲解

2. 概述

留存分析是一种用来分析用户参与情况和活跃程度的分析模型,分享进行初始行为后的用户中,有多少用户会进行后续行为,这是衡量产品对用户价值高低的重要指标。

留存分析可以帮助回答以下问题:

  • 一个新客户在未来的一段时间内是否完成了你期许用户完成的行为?
  • 某个社交产品改进了新注册用户的引导流程,期待改善用户注册后的参与程度?以及如何验证?
  • 想判断某项产品改动是否奏效,如新增了一个邀请好友的功能,观察是否有人因新增功能而多使用产品几个月?

了解留存分析的更多示例,可参考 留存分析应用示例

3. 留存分析

3.1. 留存分析

功能入口分析 > 留存分析

  1. 选择 初始行为后续行为
    1.  初始行为和后续行为的选择有两种策略:
      1. 初始行为选择用户只触发一次的事件,比如 注册、上传头像、激活设备 等,后续行为选择你期望用户重复触发的事件,比如 阅读文章、发帖、购买 等。这种留存用于对比分析不同阶段开始使用产品的新用户的参与情况,从而评估产品迭代或运营策略调整的得失。
      2. 初始行为和后续行为选择 同一个 你期待用户重复触发的事件,这种留存用于分析忠实用户的使用模式。
  2. 设置初始行为和后续行为 筛选条件。针对事件的属性,可以根据具体需求筛选初始行为或后续行为的细分维度。
  3. 添加同时显示的 指标
    1. 属性分组时,暂不支持同时展示。
    2. 可以通过阶段累计人均值指标来计算 LTV(特定日期访问的用户群体,在一定时长内所贡献的人均价值)。同时显示事件选择营收事件、同时显示指标中选择金额属性的阶段累计人均值,在表格中会显示用户的 LTV。也可给同时显示的指标增加事件筛选条件。
  4. 设置 分组
    1. 留存表格默认按照初始行为日期分组。每行的第一列代表了初始行为日期;第二列是在该日期触发了初始行为的总人数(独立用户数);后面各列,分别是在相应时间后触发后续行为的用户数,以及占初始行为人数的百分比。
    2. 有同时显示指标时,会显示对应的指标值。
    3. 除了可以按照初始行为日期进行分组查看外,还可以分别按照初始行为事件属性或后续行为事件属性进行分组查看。
    4. 当开启设置关联属性后,仅支持按照初始事件的关联属性进行分组查看。
    5. 如果选择的属性是数值类型,可以自定义分组区间。如果没有设置,查询引擎会动态计算分组区间。此设置仅在当前查询生效,将查询保存为书签后在书签中也生效。
    6. 如果选择的属性是 list 类型,list 集合中的所有属性值会被拆分成独立子项,可分别查看单个属性之下的留存分析。如果设置了多个 list 类型的分组,仅支持最后一个 list 类型的拆分显示。
  5. 设置 用户筛选条件。针对用户属性、用户分群、用户标签,筛选合适的分析对象。
    1. 用户属性为时间类型的属性
      1. 支持设置相对初始行为事件发生时间、相对后续行为事件发生时间的时间范围。对比方式包含:之前、之后、当天、当周、当月。时间粒度支持天、小时、分、秒。
      2. 支持设置相对初始行为事件发生区间、相对后续行为事件发生时间区间。可设置「过去/未来」 N「天/小时/分/秒」至「过去/未来」 N「天/小时/分/秒」。
    2. 用户分群和用户标签支持配置用户分群和标签的结果。可选择某一个固定的分群,或者按照初始行为事件的发生时间进行动态匹配。
      • 最新结果:筛选出的用户为分群的最新结果。
      • 自定义:筛选出的用户为选择的某一个分群的计算结果。
      • 按照初始行为时间匹配:可根据初始行为日期与分群日期的结果进行匹配。适用于针对于动态分群进行人群细分的留存分析。
  6. 设置关联属性。支持设置初始行为事件和后续行为事件的属性进行关联。不同事件关联的属性可以是相同属性,也可以是不同属性,但是要求属性的类型必须一致。
  7. 点击 查询 按钮。

3.2. 选择时间段和留存/流失时长

选择的时间范围是初始行为事件发生的时间范围,如上图选择 7 天留存,后续事件发生时间范围的截止日期会被延展到 2023 年 3 月 14 日( 2023 年 3月 07 日向后延展 7 天)。

可以按照日、周、月查看不同时间体量下的留存/流失情况。


留存分析中流失用户的定义是连续多天(不包含当天,即从触发初始行为事件之后,从第 1 天开始计算,连续多天)没有发生后续事件才认为是流失用户,如上图 第 2 日 流失是指 2,377 人进行初始事件后持续 2 天没有进行后续事件(不考虑用户在 06-30 号当天是否触发过后续事件)。

3.3. 显示设置

点击 显示设置 可以对留存/流失窗口关键日期进行配置。此配置适用于用户只关注关键日期留存/流失情况,不需要连续展示 N 天、N 周、N 月的留存数据。

3.4. 留存表格

在留存表格中,鼠标放到到表格中,会显示相应的提示信息。点击用户数时,可以查看用户列表、创建用户分群。

3.4.1. 如何计算一段时间内的总体留存率?

如下图所示:中国第4日总体的留存率为2021-04-05和2021-04-06两个初始行为日期的第4日留存率的「加权平均值」。

注:加权平均值计算方式为当天初始行为日期人数占比总初始行为人数的值。如2021-04-05的加权平均值=初始行为人数/(2021-04-05初始行为人数 2021-04-06初始行为人数)=144/(144 +163)

故第四日总体的留存率=34.03%*144/(144+163)+ 20.25%*163/(144+163)=49/(144+163)+33/(144+163)=(49+33)/(144+163)

即在 2.1 以后的 SA 版本中,汇总行(支持收起展开的表格行)的留存/流失率中的人数不做去重,即为下方各个时段内的留存/流失人数之和除以对应时段内的总人数之和。选择按“总体”查看时,可选择“同时展示”其他指标。同时展示的指标也会展示在表格中。



3.4.2. 浏览用户详情

表格的单元格内的数字是可以点击的,点击可以浏览这些用户的详细信息,并且进一步浏览其中单个用户的详细行为序列。

3.5. 留存变化趋势曲线

用另一种可视化方式,体现不同分组的留存情况对比。

4. 留存分析计算规则

留存分析中展示的数字代表独立用户数。表示在选定时间范围内进行了初始行为的用户,有多少用户在随后的第 n 天/周/月进行了后续行为。

4.1. 基本计算规则

假设定义的初始行为是 A 事件,后续行为是 B 事件,筛选时间段为 2015 年 1 月 1 日到 2015 年 1 月 8 日,注意这个时间范围是事件 A 发生的时间范围,事件 B 发生的时间范围是 2015 年 1 月 1日到 1 月 15 日(1 月 8 日加上 7 天)。

4.2. 未设置关联属性

下表为某用户 2015 年 1 月 1 日到 2015 年 1 月 8 日的真实行为序列和纳入计算的行为序列(保留用户当日首个初始行为事件或后续行为事件)。表格中,字母 A 和 B 为事件,数字 1,2,3 为该用户某个属性的属性值。

日期真实行为序列纳入计算的行为序列
01-01A1,A2,A2A1
01-02B2,B1,B1B2
01-03A3,A1,A1A3
01-04A1,A3,A3A1
01-05A1,A3,A3A1
01-06B1,B2,B1B1
01-07A1,A2A1
01-08B2,B1,B3B2

该用户的留存情况如下表:

初始行为日期初始事件第 1 天第 2 天第 3 天第 4 天第 5 天第 6 天第 7 天
01-01A1B2


B1
B2
01-03A3

B1
B2

01-04A1
B1
B2


01-05A1B1
B2



01-07A1B2





  • 不加分组,如果指定初始行为日期为 2015 年 1 月 1 日,则该用户分别是第 1 天、第 5 天、第 7 天的留存用户。如果不限定具体的初始行为日期,则该用户分别在 01-01、01-03、01-04、01-05、01-07发生了初始行为,后续留存天数分别为第 1 天(初始行为日期:01-01、01-05、01-07)、第 2 天(初始行为日期:01-04)、第 3 天(初始行为日期:01-03、01-05)、第 4 天(初始行为日期:01-04)、第 5 天(初始行为日期:01-01、01-03)、第 7 天(初始行为日期:01-01)。
  • 按初始行为事件 A 的属性分组,如果用户完成事件 A 的属性值各不相同,该用户只会被归到 1 月 1 日 发生的首个 A 事件的属性值 1 中(:虽然用户在 01-04 发生了事件的属性值为 3,但用户依然会被计算在属性值 1 的分组中)。该用户分别在 01-01、01-03、01-04、01-05、01-07 发生了初始行为事件 A,为 事件A的属性值为 1 分组下的第 1 天、第 2 天、第 3 天、第 4 天、第 5 天、第 7 天的留存用户。
  • 按后续行为事件 B 的属性分组,如果用户完成事件 B 的属性值各不相同,该用户只会被归到 1 月 2 日 发生的首个 B 事件的属性值 2 中。该用户分别在 01-01、01-03、01-04、01-05、01-07 发生了初始行为事件 A,为 事件 B 的属性值为 2 分组下的第 1 天、第 2 天、第 3 天、第 4 天、第 5 天、第 7 天的留存用户。
  • 按用户属性分组,比如按性别分组,若用户为女性,则该用户分别是 属性值女性 的第 1 天、第 2 天、第 3 天、第 4 天、第 5 天、第 7 天的留存用户。

4.3. 设置关联属性

下表为某用户 2015 年 1 月 1 日到 2015 年 1 月 8 日的真实行为序列和纳入计算的行为序列(同一天内初始行为事件或后续行为事件不同属性值各保留一个,且保留首个)。表格中,字母 A 和 B 为事件,数字 1、2、3 为该用户某个属性的属性值。

日期真实行为序列

纳入计算的行为序列(属性值 1)

纳入计算的行为序列(属性值 2)

纳入计算的行为序列(属性值 3)
01-01A1,A2,A2A1A2
01-02B2,B1,B1B1B2
01-03A3,A1,A1A1
A3
01-04A1,A3,A3A1
A3
01-05A1,A3,A3A1
A3
01-06B1,B2,B1B1B2
01-07A1,A2A1A2
01-08B2,B1,B3B1B2B3

按初始行为事件 A 的属性分组,如果按属性值 1 分组,则关联属性值为 1 的初始行为事件或后续行为事件才会纳入计算,该用户分别是属性值 1 的第 1 天、第 2 天、第 3 天、第 4 天、第 5 天、第 7 天的留存用户。如果按属性值 2 分组,则关联属性值为 2 的初始行为事件或后续行为事件才会纳入计算,该用户分别是属性值 2 的第 1 天、第 5 天、第 7 天的留存用户。同理,该用户分别是属性值 3 的第 3 天、第 4 天、第 5 天的留存用户。

4.4. 筛选条件的含义

和其他分析功能一样,留存分析也提供了筛选功能。留存分析的筛选提供了两种不同的筛选类型:

  • 用户属性上的筛选:例如,我们添加的筛选条件是 性别 ,则只有属性中 性别 的用户才满足这个筛选条件,并且出现在筛选后的留存分析结果中。
  • 事件属性的筛选:和漏斗的触发限制条件含义相同,指定事件满足指定属性的过滤。

4.5. 分组的含义

留存分析提供了两种不同的分组类型。我们以一个初始行为是 A,后续行为是 B,时间范围是 2015 年 1 月 1 日到 1 月 8 日的 7 天留存来进行详细说明:

  • 用户属性上的分组:根据用户属性来进行更进一步的分组。例如我们添加的分组条件是 性别,就会分别对留存分析的结果按照 来进行分组。
  • 事件属性的分组:例如,我们选择的分组设置是初始行为的属性 屏幕高度,则这个分组表示,在 2015 年 1 月 1 日到 1 月 15 日这个时间范围内,按初始行为的 屏幕高度 这个属性的值来对他们进行分组;下面是几个具体的例子的描述:
    • 某个用户在这个时间段内的行为序列是 A、B、C、A、B,第一次出现的 A 的 屏幕高度 值为 320,第二次出现的 A 的 屏幕高度 值为 1080,因为按照首次出现的 A 事件的 屏幕高度 来分组,所以这个用户会被划分到 320 这个分组的统计结果中。
    • 某个用户在这个时间段内的行为序列是 A、A,这个用户在初始行为 A 事件后没有后续行为。第一次出现的 A 的 屏幕高度 值为 1080,第二次出现的 A 的 屏幕高度 值为 320,因为按照首次出现的 A 事件的 屏幕高度 来分组,所以这个用户会被划分到 1080 这个分组的统计结果中。

5. 常见问题

5.1. 为什么要做留存分析?看活跃用户百分比不够吗?

按初始行为时间分组的留存分析可以消除用户增长对用户参与数据带来的影响。如果产品目前处于快速增长阶段,很有可能新用户中的活跃用户数增长掩盖了老用户活跃度的变化。通过留存分析,你可以将用户按照注册时间分段查看,得出类似如下结论:“三月份改版前,该月注册的用户 7 天留存只有 15%;但是四月份改版后,该月注册的用户 7 天留存提高到了 20%。” 同理,按照非时间维度的留存分析具有类似价值,比如,可以查看新功能上线之后,对不同性别用户的留存是否带来不同效果。我们在分析用户的留存时,一定要根据实际的业务需求,找到有价值的后续行为,对用户的价值留存进行分析,才能对产品的优化和改进提供实质性指导建议。