留存分析
1. 影片版講解
2. 留存分析概述
留存分析是一種用來分析用戶參與情況/活躍程度的分析模型,考查進行初始行為後的用戶中,有多少人會進行後續行為。這是衡量產品對用戶價值高低的重要指標。
留存分析可以幫助回答以下問題:
- 一個新客戶在未來的一段時間內是否完成了您期許用戶完成的行為?如支付訂單
- 某個社交產品改進了新註冊用戶的引導流程,期待改善用戶註冊後的參與程度,如何驗證?
- 想判斷某項產品改動是否奏效,如新增了一個邀請好友的功能,觀察是否有人因新增功能而多使用產品幾個月?
3. 留存分析介面功能簡介
3.1. 選擇初始行為和後續行為
初始行為和後續行為的選擇有兩種策略:
- 初始行為選擇用戶只觸發一次的事件,比如“註冊”、“上傳頭像”、“啟用裝置”等,後續行為選擇你期望用戶重複觸發的事件,比如“閱讀文章”、“發表貼文”、“購買”等。這種留存用於對比分析不同階段開始使用產品的新用戶的參與情況,從而評估產品迭代或營運策略調整的得失。
- 初始行為和後續行為選擇相同的,期待用戶重複觸發的事件。這種留存用於分析忠實用戶的使用模式。
3.2. 設定初始行為和後續行為篩選條件
針對事件的屬性,可以根據具體需求篩選初始行為或後續行為的細分維度。比如,我們想分析台北市的用戶註冊後,後續購買手機的留存情況,那麼可以定義初始行為是“註冊”,同時增加篩選條件“城市等於台北”,後續行為是“支付訂單的商品細節”,同時增加篩選條件“商品類型等於手機”,即可滿足分析需求。
3.3. 設定用戶篩選條件
針對用戶屬性,篩選合適的分析對象。比如,只查看女性用戶的留存情況。
3.4. 選擇考查的時間段
這裡選擇的時間範圍是初始行為事件發生的時間範圍,如上圖選擇“7 天留存”,後續事件發生時間範圍的截止日期會被展延到 2017 年 1 月 4 日( 2016 年 12 月 28 日向後展延 7 天)。
可以按照日、周、月查看不同時間體量下的留存/流失情況。1.6.5 版提供了查看流失用戶的功能,在上圖圈紅處點擊可以選擇流失時間。
留存分析中流失用戶的定義是連續多“天”(不包含當天,即從觸發初始行為事件之後,從第 1 天開始計算,連續多“天”)沒有發生後續事件才認為是流失用戶,如上圖“第2天”流失是指 103,582 人進行初始事件後持續 2 天沒有進行後續事件(不考慮用戶在 6-6 號當天是否觸發過後續事件)。
3.5. 設定關聯屬性
支援設定初始行為事件和後續行為事件的屬性進行關聯。不同事件關聯的屬性可以是相同屬性,也可以是不同屬性,但是要求屬性的類型必須一致。 舉例:某內容類網站想要知道各頁面的七日留存,因此需要在初始行為事件App 瀏覽頁面 和後續行為事件 App 瀏覽頁面 中增加關聯屬性頁面標題,此時就會按照該屬性進行關聯,以保證用戶嚴格按照該模式配對。
3.6. 留存表格
留存表格預設按照初始行為日期分組。每行的第一列代表了初始行為日期;第二列是在該日期觸發了初始行為的總人數(獨立用戶數);後面各列,分別是在相應時間後觸發後續行為的用戶數,以及佔初始行為人數的百分比。
除了可以按照初始行為日期進行分組查看外,還可以分別按照初始行為事件屬性或後續行為事件屬性進行分組查看。如選擇初始行為事件屬性按註冊管道進行分組,我們則可以看到不同註冊管道的後續留存情況。
需要注意的是,當開啟設定關聯屬性後,僅支援按照初始事件的關聯屬性進行分組查看。如選擇初始行為事件和後續行為事件的關聯屬性為頁面標題,則可以看到不同頁面的後續留存情況。
覺得有點複雜?沒關係,滑鼠懸浮到每個單元格上,會有文字提示告訴你這個單元格的具體含義。同時,單元格的背景顏色也能直觀反映留存情況。
如果這裡選擇的屬性是數值型別,可以自定義分組區間。如果沒有設定,查詢引擎會動態計算分組區間。此設定僅在當前查詢生效,將查詢保存為書籤後在書籤中也生效。
3.7. 瀏覽用戶詳情
表格的單元格內的數字是可以點擊的,點擊可以瀏覽這些用戶的詳細信息,並且進一步瀏覽其中單個用戶的詳細行為序列。
3.8. 留存變化趨勢曲線
用另一種可視化方式,體現不同分組的留存情況對比。
4. 留存是如何計算的
留存分析中展示的數字代表獨立用戶數。表示在選定時間範圍內進行了初始行為的用戶,有多少人在隨後的第 n 天/周/月進行了後續行為。
4.1. 基本計算規則
假設定義的初始行為是 A 事件,後續行為是 B 事件,篩選時間段為 2015 年 1 月 1 日到 2015 年 1 月 8 日,注意這個時間範圍是事件 A 發生的時間範圍,事件 B 發生的時間範圍是 2015 年 1 月 1日到 1 月 15 日(1 月 8 日加上 7 天)。
4.2. 未設定關聯屬性
下表為某用戶2015 年 1 月 1 日到 2015 年 1 月 8 日的真實行為序列和納入計算的行為序列(保留用戶當日首個初始行為事件或後續行為事件)。表格中,字母 A 和 B 為事件,數字 1,2,3 為該用戶某個屬性的屬性值。
日期 | 真實行為序列 | 納入計算的行為序列 |
---|---|---|
01-01 | A1,A2,A2 | A1 |
01-02 | B2,B1,B1 | B2 |
01-03 | A3,A1,A1 | A3 |
01-04 | A1,A3,A3 | A1 |
01-05 | A1,A3,A3 | A1 |
01-06 | B1,B2,B1 | B1 |
01-07 | A1,A2 | A1 |
01-08 | B2,B1,B3 | B2 |
該用戶的留存情況如下表:
初始行為日期 | 初始事件 | 第 1 天 | 第 2 天 | 第 3 天 | 第 4 天 | 第 5 天 | 第 6 天 | 第 7 天 |
---|---|---|---|---|---|---|---|---|
01-01 | A1 | B2 | B1 | B2 | ||||
01-03 | A3 | B1 | B2 | |||||
01-04 | A1 | B1 | B2 | |||||
01-05 | A1 | B1 | B2 | |||||
01-07 | A1 | B2 |
1.不加分組,如果指定初始行為日期為 2015 年 1 月 1 日,則該用戶分別是第 1 天,第 5 天,第 7 天的留存用戶。
2.按初始行為事件 A 的屬性分組,如果用戶完成事件 A 的屬性值各不相同,該用戶只會被歸到 1 月 1 日 發生的首個 A 事件的屬性值 1 中。去重後,該用戶分別是屬性值 1 的第 1 天,第 2 天,第 3 天,第 4 天,第 5 天,第 7 天的留存用戶。
3.按後續行為事件 B 的屬性分組,如果用戶完成事件 B 的屬性值各不相同,該用戶只會被歸到 1 月 2 日 發生的首個 B 事件的屬性值 2 中。去重後,該用戶分別是屬性值 2 的第 1 天,第 2 天,第 3 天,第 4 天,第 5 天,第 7 天的留存用戶。
4.按用戶屬性分組,比如按性別分組,若用戶為女性,則該用戶分別是屬性值女性的第 1 天,第 2 天,第 3 天,第 4 天,第 5 天,第 7 天的留存用戶。
4.2.1. 設定關聯屬性
下表為某用戶 2015 年 1 月 1 日到 2015 年 1 月 8 日的真實行為序列和納入計算的行為序列(同一天內初始行為事件或後續行為事件不同屬性值各保留一個,且保留首個)。表格中,字母 A 和 B 為事件,數字 1,2,3 為該用戶某個屬性的屬性值。
日期 | 真實行為序列 | 納入計算的行為序列(屬性值1) | 納入計算的行為序列(屬性值 2) |
---|---|---|---|
01-01 | A1,A2,A2 | A1 | A2 |
01-02 | B2,B1,B1 | B1 | B2 |
01-03 | A3,A1,A1 | A1 | |
01-04 | A1,A3,A3 | A1 | |
01-05 | A1,A3,A3 | A1 | |
01-06 | B1,B2,B1 | B1 | B2 |
01-07 | A1,A2 | A1 | A2 |
01-08 | B2,B1,B3 | B1 | B2 |
按初始行為事件 A 的屬性分組,如果按屬性值 1 分組,則關聯屬性值為 1 的初始行為事件或後續行為事件才會納入計算,該用戶分別是屬性值 1 的第 1 天,第 2 天,第 3 天,第 4 天,第 5 天,第 7 天的留存用戶。如果按屬性值 2 分組,則關聯屬性值為 2 的初始行為事件或後續行為事件才會納入計算,該用戶分別是屬性值 2 的第 1 天,第 5 天,第 7 天的留存用戶。同理,該用戶分別是屬性值 3 的第 3 天,第 4 天,第 5 天的留存用戶。
4.3. 篩選條件的含義
和其他分析功能一樣,留存分析也提供了篩選功能。留存分析的篩選提供了兩種不同的篩選類型。
- 用戶屬性上的篩選:例如,我們增加的篩選條件是“性別”為“男”,則只有屬性中“性別”為“男”的用戶,才滿足這個篩選條件,並且出現在篩選後的留存分析結果中;
- 事件屬性的篩選:和漏斗的觸發限制條件含義相同,指定事件滿足指定屬性的過濾。
4.4. 分組的含義
留存分析提供了兩種不同的分組類型。我們以一個初始行為是 A,後續行為是 B,時間範圍是 2015 年 1 月 1 日到 1 月 8 日的 7 天留存來進行詳細說明:
- 用戶屬性上的分組:根據用戶屬性來進行更進一步的分組。例如我們增加的分組條件是“性別”,那麼,就會分別對留存分析的結果按照“男”、“女”來進行分組;
- 事件屬性的分組:例如,我們選擇的分組設定是初始行為的屬性“螢幕高度”,則這個分組表示,在 2015 年 1 月 1 日到 1 月 15 日這個時間範圍內,按初始行為的“螢幕高度”這個屬性的值來對他們進行分組;下面是幾個具體的例子的描述:
- 某個用戶在這個時間段內的行為序列是 A、B、C、A、B,第一次出現的 A 的“螢幕高度”值為“320”,第二次出現的 A 的“螢幕高度”值為“1080”,因為按照首次出現的 A 事件的“螢幕高度”來分組,所以這個用戶會被劃分到“320”這個分組的統計結果中;
- 某個用戶在這個時間段內的行為序列是 A、A,這個用戶在初始行為 A 事件後沒有後續行為。第一次出現的 A 的“螢幕高度”值為“1080”,第二次出現的 A 的“螢幕高度”值為“320”,因為按照首次出現的 A 事件的“螢幕高度”來分組,所以這個用戶會被劃分到“1080”這個分組的統計結果中;
5. FAQ
5.1. 為什麼要做留存分析?看活躍用戶百分比不夠嗎?
按初始行為時間分組的留存分析可以消除用戶增長對用戶參與數據帶來的影響。如果產品目前處於快速增長階段,很有可能新用戶中的活躍用戶數增長掩蓋了老用戶活躍度的變化。通過留存分析,你可以將用戶按照註冊時間分段查看,得出類似如下結論:“三月份改版前,該月註冊的用戶 7 天留存只有 15%;但是四月份改版後,該月註冊的用戶 7 天留存提高到了 20%。” 同理,按照非時間維度的留存分析具有類似價值,比如,可以查看新功能上線之後,對不同性別用戶的留存是否帶來不同效果。我們在分析用戶的留存時,一定要根據實際的業務需求,找到有價值的後續行為,對用戶的價值留存進行分析,才能對產品的優化和改進提供實質性指導建議。