屬性篩選條件說明
什麼是篩選條件
篩選條件是為了在我們取到的數據集中,透過設定一個條件進行過濾,獲取我們最終想得到的子數據集進行分析。神策所有的分析功能中都有篩選條件的選項,均可以實現根據事件的屬性進行篩選或根據用戶的屬性進行篩選。
篩選條件可類比於 SQL 中的 where 條件語句
當使用用戶篩選條件時, where 條件作用於 users 表;當使用事件篩選條件時, where 條件作用於 events 表
使用流程
在神策所有的分析功能中,我們可以看到「篩選條件」、「觸發限制條件」等按鈕時,代表此處可以對用戶或事件進行篩選,參考上圖中的標識,具體設定流程如下:
點擊跳出篩選條件輸入框,可以同時添加一個或多個篩選條件
在 B 中選擇篩選事件或用戶的屬性
在 C 中選擇屬性的 判斷類型 ,不同的屬性型別擁有不同的 判斷類型,不同 判斷類型 的使用方法可參考第 3 部分
在 D 選項中輸入 判斷值 後,分析結果即會根據輸入條件進行篩選
篩選條件分類
按目標
篩選用戶:篩選條件作用於用戶表,只看符合篩選條件的那些用戶;一般在用戶屬性上進行條件設定,或者選擇用戶分群獲取符合分析條件的用戶。
篩選事件:篩選條件作用於事件,只看符合篩選條件的事件;一般在事件屬性上進行條件設定。
按數據型別
不管是為了篩選出不同用戶或篩選不同事件,具體的每一個篩選條件的設定,都可以按其數據型別來了解。
字串型別屬性篩選
當篩選的屬性為字串型別時,可以看到如上圖中標識的判斷類型,具體每個判斷類型的使用可參考下表:
判斷類型 | 類比 SQL | 描述說明 |
---|---|---|
等於 | = | 精確判斷,只有選擇的事件屬性等於輸入的判斷值時,該事件才會才會進入分析過程;當判斷值存在多個時,事件屬性值等於任意一個,該事件都會進入分析的數據集 |
不等於 | != | 精確判斷,只有選擇的事件屬性不等於輸入的判斷值時,該事件才會才會進入分析過程;當判斷值存在多個時,事件屬性值等於任意一個,該事件就不會進入分析過程 |
包含 | LIKE "%$判斷值 %" | 匹配判斷,當屬性欄位中包含判斷值,該事件或用戶就會進入分析過程 |
不包含 | NOT LIKE "%$判斷值 %" | 匹配判斷,與“包含”相反,當屬性欄位中包含判斷值,該事件不會進入分析過程 |
不為空 | Length($屬性 )>0 | 當屬性欄位中有值(字串長度大於 0 )時,事件或用戶才會進入分析過程 |
為空 | ="" | 當屬性欄位中值為空字串時,事件或用戶才會進入分析過程 |
沒值 | IS NULL | 只有屬性欄位中值為 NULL 時,事件或用戶才會進入分析過程 |
有值 | IS NOT NULL | 只有屬性欄位中值不為 NULL 時,事件或用戶才會進入分析過程 |
正規匹配 | 匹配判斷,符合條件的數據進入分析過程,具體請參考:正規表達式 | |
正規不匹配 | 匹配判斷,只有不符合正則條件的數據進入分析過程,具體請參考:正規表達式 |
數值型別屬性篩選
當篩選的屬性為數字型別時,可以看到如上圖中標識的判斷類型,具體每個判斷類型的使用可參考下表:
判斷類型 | 類比表達式 | 描述說明 |
---|---|---|
等於 | = | 類同於字串型別 |
不等於 | != | 類同於字串型別 |
小於 | < | 所選屬性值小於判斷值的事件才會進入分析過程 |
大於 | > | 所選屬性值大於判斷值的事件才會進入分析過程 |
區間 | between . and . | 所選屬性值處於設定的判斷值所形成的閉區間時,事件才會進入分析流程;如判斷值設定為 10 和 100 時,所選屬性值需要滿足 [10,100] 區間 |
有值 | IS NOT NULL | 類同於字串型別 |
沒值 | IS NULL | 類同於字串型別 |
時間型別屬性篩選
名詞解釋
- 絕對時間:有明確開始和截止時間的一個固定時間範圍
- 相對時間:相對於某個時間點,確定一個開始時間和截止時間的時間範圍
- 相對當前時間點:相對於當前之前的一段時間範圍,比如之前 1 小時
- 相對當前時間區間:相對當前的時間點,確定一個開始時間和截止時間
當篩選的屬性為時間型別時,可以看到如上圖所示的判斷類型,具體每個判斷類型使用可參考如下:
絕對時間
如設定絕對時間在 2017-07-04 00:00 至 2017-07-11 00:00,則所選屬性時間範圍在此區間(包含區間端點)的數據會進入分析過程
相對當前時間點
如相對當前時間點在 1 天之內,則表示當前時間點減一天為起點,當前時間點為終點的時間區間。即 [當前時間點 - 1 天, 當前時間點]
如相對當前時間點 1 天之前,則表示當前時間點減一天為終點之前的時間區間。即 ( 無窮小時間, 當前時間點 - 1 天]
相對當前時間區間
如設定相對當前時間的過去 5 天到過去 3 天之內,則表示以當前時間點 - 5 天為起點,以當天時間點 - 3 天為終點的時間區間,即 [當前時間點 - 5 天, 當天時間點 - 3 天]
相對事件發生時間
此處以事件發生的時間錨點去設定時間區間的起點和終點,所以對於每一條需要判斷的事件或用戶數據,所對應判斷的時間區間是不一樣的。
比如我們想要看到購買事件發生前 5 分鐘進行註冊事件的用戶數量時,可設定 註冊時間 相對事件發生時間 在之前 5 分鐘內。基於“用戶註冊後,立馬購買的商品是吸引用戶註冊的原因”這樣一個假設,我們可以查看那類型商品比較容易吸引用戶註冊來購買。或者替換成優惠券,可查看那類型優惠券更容易吸引用戶。
此處的「之前 N 天內」或「之後 N 天內」均包含事件發生當天。
有值 & 沒值
請參考字串型別中,有值 & 沒值的描述
布林型別屬性篩選
當篩選的屬性為布林型別時,可以看到如上圖所示的判斷類型,具體每個判斷類型使用如下:
為真
表示當選擇屬性值為 TURE 時,數據才會進入分析過程。
為假
表示當選擇屬性值為 FALSE 時,數據才會進入分析過程。
有值&沒值
請參考字串中,有值 & 沒值的描述
帶字典型別屬性的篩選
在神策分析的元數據管理中,可以對設定 維度字典,對於已經設定 維度字典 的欄位,篩選條件如下圖,具體的判斷欄位使用可參考字串型別中相應型別。
用戶分群的篩選
用戶分群分為普通分群和預測分群,在進行條件篩選時,對於選擇普通分群,則判斷條件選擇跟布林型別相同,表示用戶是否在該分群之內。對於選擇預測分群,則判斷條件與字典型別屬性欄位的篩選相同,這是因為判斷一個用戶是否屬於預測分群並非 100% 確定的,而是分成幾種可能性表述的。