概述

在用戶畫像系統中,可以通過智慧演算法,尋找到與「種子人群」特徵相似的「相似使用者群」。
針對「相似使用者群」我們可以進行有針對性的運營策略。

當前相似人群擴散功能,可以較好的支援「流失預測」場景。
對於「轉化預測」「偏好預測」等場景的預測準確度,還需要待驗證和優化。 建議其他場景的預測結果作為參考值來使用。


生成相似人群

相似人群的生成步驟可以分為三步:種子人群選擇 → 相似特徵選擇 → 擴散人群範圍選擇

種子人群選擇

在相似人群的計算中,種子人群會作為預測演算法的訓練樣本。 種子人群具體分為:正向種子人群和負向種子人群。
正向種子人群:預測人群的結果是與正向種子人群相似的;
負向種子人群:預測人群的結果是與負向種子人群相悖的。

相似人群擴散功能支援其使用使用者標籤、使用者屬性、使用者群、使用者行為、用戶行為序列作為種子人群的篩選條件,進行種子人群的構建。
負向種子人群可以進行手動選取或選擇讓系統進行隨機選取,為了預測的效果,建議手動選擇負向人群。

選擇正向和負向人群時,需要注意:

  • 盡量選擇特徵鮮明的人群作為種子人群(建議提前通過分群創建好正向和負向種子人群)
  • 人群選擇後,請先進行預估
  • 盡可能保證正向種子人群和負向種子人群的量級持平(若正向種子人群少於負向人群,則會隨機補齊負向種子人群;當正向種子人群數量多於 10w 人時,會進行隨機裁剪;若兩者有重疊則會將該用戶劃分到正向種子人群中)


相似特徵選擇

相似特徵是相似人群計算中的紐帶,系統會根據選取的相似特徵來學習和判斷其是否相似。
畫像系統支援使用使用者的標籤、使用者屬性、用戶行為的指標結果作為相似特徵。
 

選擇特徵時,建議:

  • 盡可能使用使用者標籤進行特徵的選取,會加快相似人群的訓練計算速度
  • 選取和種子人群有緊密關聯的特徵作為相似特徵


擴散人群範圍選擇

人群範圍選擇是選擇最後我們的預測人群範圍,系統使用正向種子、負向種子和相似特徵對在「人群範圍」中的用戶進行相似性預測
「人群範圍」支援使用使用者標籤、使用者屬性、使用者群、使用者行為、用戶行為序列作為擴散人群的篩選條件,進行人群的構建
同時,我們可以選擇「是否包含種子人群」:若選擇「不包含」,則會在計算計算結果中剔除掉種子人群
另外,我們可以限制目標人群的數量,系統會返回相似度較高的人群名單

使用人群結果

任務計算完成後,我們可以在清單中看到最後的預測結果。

我們可以在介面中下載最終的計算結果人群。

詳情

用戶分布圖:相似人群的分布圖,可以觀察出目標人群的相似度分佈情況

特徵影響指數:影響指數越大,可以反應出這個特徵越重要

規則

可以查看相似人群的選取規則