什麼是篩選條件

篩選條件是為了在我們取到的數據集中,透過設定一個條件進行過濾,獲取我們最終想得到的子數據集進行分析。神策所有的分析功能中都有篩選條件的選項,均可以實現根據事件的屬性進行篩選或根據用戶的屬性進行篩選。 

篩選條件可類比於 SQL 中的 where 條件語句

當使用用戶篩選條件時, where 條件作用於 users 表;當使用事件篩選條件時, where 條件作用於 events 表 

使用流程

在神策所有的分析功能中,我們可以看到「篩選條件」、「觸發限制條件」等按鈕時,代表此處可以對用戶或事件進行篩選,參考上圖中的標識,具體設定流程如下:

  1. 點擊跳出篩選條件輸入框,可以同時添加一個或多個篩選條件

  2. 在 B 中選擇篩選事件或用戶的屬性

  3. 在 C 中選擇屬性的 判斷類型 ,不同的屬性型別擁有不同的 判斷類型,不同 判斷類型 的使用方法可參考第 3 部分

  4. 在 D 選項中輸入 判斷值 後,分析結果即會根據輸入條件進行篩選

篩選條件分類

按目標

篩選用戶:篩選條件作用於用戶表,只看符合篩選條件的那些用戶;一般在用戶屬性上進行條件設定,或者選擇用戶分群獲取符合分析條件的用戶。

篩選事件:篩選條件作用於事件,只看符合篩選條件的事件;一般在事件屬性上進行條件設定。

按數據型別

不管是為了篩選出不同用戶或篩選不同事件,具體的每一個篩選條件的設定,都可以按其數據型別來了解。

字串型別屬性篩選

當篩選的屬性為字串型別時,可以看到如上圖中標識的判斷類型,具體每個判斷類型的使用可參考下表:

判斷類型

類比 SQL

描述說明

等於=

精確判斷,只有選擇的事件屬性等於輸入的判斷值時,該事件才會才會進入分析過程;當判斷值存在多個時,事件屬性值等於任意一個,該事件都會進入分析的數據集

等於!=

精確判斷,只有選擇的事件屬性不等於輸入的判斷值時,該事件才會才會進入分析過程;當判斷值存在多個時,事件屬性值等於任意一個,該事件就不會進入分析過程

包含LIKE "%$判斷%"

匹配判斷,當屬性欄位中包含判斷值,該事件或用戶就會進入分析過程

不包含NOT LIKE "%$判斷%"匹配判斷,與“包含”相反,當屬性欄位中包含判斷值,該事件不會進入分析過程
不為空Length($屬性)>0

當屬性欄位中有值(字串長度大於 0 )時,事件或用戶才會進入分析過程

為空=""當屬性欄位中值為空字串時,事件或用戶才會進入分析過程
沒值IS NULL只有屬性欄位中值為 NULL 時,事件或用戶才會進入分析過程
有值IS NOT NULL只有屬性欄位中值不為 NULL 時,事件或用戶才會進入分析過程
正規匹配

匹配判斷,符合條件的數據進入分析過程,具體請參考:正規表達式

正規不匹配

匹配判斷,只有不符合正則條件的數據進入分析過程,具體請參考正規表達式

數值型別屬性篩選

當篩選的屬性為數字型別時,可以看到如上圖中標識的判斷類型,具體每個判斷類型的使用可參考下表:

判斷類型類比表達式描述說明
等於=類同於字串型別
等於!=類同於字串型別
<所選屬性值小於判斷值的事件才會進入分析過程
>所選屬性值大於判斷值的事件才會進入分析過程
區間between . and .所選屬性值處於設定的判斷值所形成的閉區間時,事件才會進入分析流程;如判斷值設定為 10 和 100 時,所選屬性值需要滿足 [10,100] 區間
有值IS NOT NULL類同於字串型別
沒值IS NULL類同於字串型別

時間型別屬性篩選

名詞解釋

  • 絕對時間:有明確開始和截止時間的一個固定時間範圍
  • 相對時間:相對於某個時間點,確定一個開始時間和截止時間的時間範圍
  • 相對當前時間點:相對於當前之前的一段時間範圍,比如之前 1 小時
  • 相對當前時間區間:相對當前的時間點,確定一個開始時間和截止時間

當篩選的屬性為時間型別時,可以看到如上圖所示的判斷類型,具體每個判斷類型使用可參考如下:

絕對時間

如設定絕對時間在 2017-07-04 00:00 至 2017-07-11 00:00,則所選屬性時間範圍在此區間(包含區間端點)的數據會進入分析過程

相對當前時間點

如相對當前時間點在 1 天之內,則表示當前時間點減一天為起點,當前時間點為終點的時間區間。即 [當前時間點 - 1 天, 當前時間點]

如相對當前時間點 1 天之前,則表示當前時間點減一天為終點之前的時間區間。即 ( 無窮小時間, 當前時間點 - 1 天]

相對當前時間區間

如設定相對當前時間的過去 5 天到過去 3 天之內,則表示以當前時間點 - 5 天為起點,以當天時間點 - 3 天為終點的時間區間,即 [當前時間點 - 5 天, 當天時間點 - 3 天]

相對事件發生時間

此處以事件發生的時間錨點去設定時間區間的起點和終點,所以對於每一條需要判斷的事件或用戶數據,所對應判斷的時間區間是不一樣的。

比如我們想要看到購買事件發生前 5 分鐘進行註冊事件的用戶數量時,可設定 註冊時間 相對事件發生時間 在之前 5 分鐘內。基於“用戶註冊後,立馬購買的商品是吸引用戶註冊的原因”這樣一個假設,我們可以查看那類型商品比較容易吸引用戶註冊來購買。或者替換成優惠券,可查看那類型優惠券更容易吸引用戶。

此處的「之前 N 天內」或「之後 N 天內」均包含事件發生當天。

有值 & 沒值

請參考字串型別中,有值 & 沒值的描述 

布林型別屬性篩選

當篩選的屬性為布林型別時,可以看到如上圖所示的判斷類型,具體每個判斷類型使用如下:

為真

表示當選擇屬性值為 TURE 時,數據才會進入分析過程。

為假

表示當選擇屬性值為 FALSE 時,數據才會進入分析過程。

有值&沒值

請參考字串中,有值 & 沒值的描述

帶字典型別屬性的篩選

在神策分析的元數據管理中,可以對設定 維度字典,對於已經設定 維度字典 的欄位,篩選條件如下圖,具體的判斷欄位使用可參考字串型別中相應型別。

用戶分群的篩選

用戶分群分為普通分群和預測分群,在進行條件篩選時,對於選擇普通分群,則判斷條件選擇跟布林型別相同,表示用戶是否在該分群之內。對於選擇預測分群,則判斷條件與字典型別屬性欄位的篩選相同,這是因為判斷一個用戶是否屬於預測分群並非 100% 確定的,而是分成幾種可能性表述的。