1. 神策分析單機版對硬體規格的要求?

  • 單機版對硬體的規格有如下要求:
    • CPU: 4 核心或更高(不含超執行緒),支援 SSSE3 和 AVX 指令集;
    • 記憶體: 24G 或更高;
    • 作業系統: 建議使用 CentOS 7.x 或 RHEL 7.x, 也支援滿足核心版本要求的 CentOS 6.x 或 RHEL 6.x
    • 核心版本:>= 2.6.32-674
    • 檔案系統:ext4/xfs
    • 硬碟:電腦 home 分區可用空間大於 30G,數據碟容量大於 500G,要求如下
      • 如果是物理硬碟,做 RAID1 或更高級別的設定,以保證數據安全;
      • 如果是雲端硬碟,需要 SSD 雲端硬碟或者其它吞吐在 150MB/s 以上的硬碟;
    • 不支援與其它服務混合部署;
    • 安裝需要 root 權限。

2. 神策分析叢集版對硬體規格的要求?

  • 叢集版對於硬體的規格有如下要求:
    • 最少 3 個節點;
    • CPU: 16 核心或更高(不含超執行緒,測試用可降至 8 核),支援 SSSE3 和 AVX 指令集;
    • 記憶體: 64G 或更高;
    • 硬碟: 每台電腦 home 分區可用空間大於 30G,數據碟要求如下
      • 如果是物理硬碟:
        • 2 塊系統碟/元數據碟:採用 RAID1 或更高級別,單盤容量 600G 以上,且順序讀寫在 150 MB/s 以上,建議採用 SSD 硬碟;
        • 4 塊或以上數據碟:不做 RAID 或 LVM,單盤容量 2T 以上,且總吞吐在 600MB/s 以上;
      • 如果是雲端硬碟:
        • 1 塊元數據碟:SSD 雲端硬碟,或其它 IOPS 在 1000 以上的硬碟,容量 600G 以上;
        • 多塊數據碟:SSD 雲端硬碟,或其它總吞吐在 600MB/s 以上的硬碟,單盤容量 1TB 以上;
    • 作業系統: 建議使用 CentOS 7.x 或 RHEL 7.x, 也支援滿足核心版本要求的 CentOS 6.x 或 RHEL 6.x
    • 核心版本:>= 2.6.32-674
    • 檔案系統: ext4/xfs
    • 網絡:千兆(>= 5 個節點,需使用萬兆),所有電腦在一個交換器下,並且可以互相 ssh 登入。如果是雲伺服器儘量開啟網絡優化。
    • 負載均衡:需要提供獨立的前置負載均衡系統。
    • 不支援與其它服務混合部署;
    • 安裝需要 root 權限。

3. 神策分析中儲存用戶行為數據需要多大硬碟?

  • 按經驗,1 億條用戶行為數據,在壓縮前約 40GB,壓縮後約 10GB。特別地,在叢集版中預設使用三副本,則 1 億條數據壓縮前約 120GB,壓縮後約 30GB。 

4. 使用神策分析採集用戶行為數據,需要多大頻寬?

  • 伺服器頻寬主要受峰值在線用戶數影響,數據採集服務對伺服器下行頻寬要求遠高於上行頻寬。對於 App 採集數據,預設每 15 秒壓縮並上傳一次,按經驗,每個用戶平均每 5 秒產生一條事 件,則伺服器 10Mbps 下行頻寬/1Mbps 上行頻寬能支援約 5 萬峰值在線;對於 JavaScript 採集,由於數據實時上傳且無壓縮,伺服器 10Mbps 下行頻寬/1Mbps 上行頻寬能支援約 2 萬峰值在線。 

5. 是否還可以提供數據方面的技術服務? 

  • 我們在提供產品以外,還有償提供如下的技術服務:幫助客戶分解數據需求,確定核心指標;幫助客戶根據數據需求理清數據源,產生規範的日誌數據;幫助客戶基於我們的產品產生 Dashboard,監控各個核心指標;應客戶需求,協助完成一些具體的數據分析工作。

6. 你們的 Demo 為什麼不能匯入數據? 

  • A:Demo 環境主要是給大家示範神策分析的查詢、可視化、分析等方面的資訊,匯入的數據是我們後台模擬產生自動匯入的數據。如果想嘗試匯入自己的數據進行查詢和分析,可以聯繫我們取得相應的試用環境。

7. 神策分析如何保證客戶數據的可靠性?

  • A:神策分析的叢集版和單機版,都採用了各種方案,保證數據的高可靠性:
    • 叢集版:
      • 神策分析的叢集版採用了分佈式的儲存方案,每份數據都有三倍冗餘儲存,保證了數據的高可靠性;
    • 單機版:
      • 對於採用雲主機的客戶,我們推薦客戶使用 IaaS 提供的雲硬碟(例如 UCloud 的雲 SSD 硬碟)保證硬碟的高可靠性;
      • 對於使用物理電腦的客戶,我們也建議客戶採用至少 RAID10 的底層儲存方案,來保證硬碟的高可靠性;
      • 神策分析也建議,客戶在應用層能夠對短期的數據進行打包和備份;
    • 結合以上的種種方案,可以相信我們為客戶的數據提供了很高的可靠性。

8. 神策分析如何保證客戶數據的安全性?

  • A:我們從私有部署和雲版兩種部署來回答這個問題:
    • 私有部署:
      • 從數據儲存上,這部分數據是儲存在客戶自己的電腦上,不存在安全顧慮;
      • 從查詢介面上,可以只對內網提供查詢服務,並且也是有登入權限認證的;
      • 從數據傳輸上,如果選擇後端傳輸數據,則是內網到內網的傳輸,不存在安全顧慮,如果是前端埋點,我們支援 https 上傳數據然後再內網轉發
    • 雲版:
      • 從數據儲存上,我們提供的是單租戶的部署方案,不同客戶之間數據是完全物理隔離的;
      • 從查詢介面上,不同客戶是不同的權限帳號體系,也有不同的查詢 token;
      • 從數據傳輸上,不同客戶使用不同數據上傳 token,我們也支援 https 上傳數據

9. 私有部署版的神策分析應該如何選擇伺服器的設定:

  • A:神策分析支援在不同設定、不同規模的伺服器上執行,而影響伺服器設定選擇的因素其實是非常複雜的,包括但不限於以下這些:
    • 每天匯入的數據量:例如每天約需要匯入 1000w 用戶行為,且往後每月約增長 20%。
    • 歷史累積的數據量:例如已經有 3 年,累計 100 億的歷史數據,且希望在一週之內完成匯入。
    • 查詢分析場景:例如大部分查詢分析都使用最近一個月的數據,希望能夠在 10 秒內得出結果;少數查詢分析使用幾個月或更長的數據,希望在一分鐘內得出結果;可以接受在一些場景下使用抽樣查詢。
    • 平台使用場景:例如需要和 CRM、行銷推播系統等進行對接,或者需要基於神策分析的數據進行離線數據挖掘等。

神策分析的諮詢顧問會根據以上資訊為使用者進行詳細的評估並給出最合適的伺服器設定建議,而如果使用者暫時不能提供足夠的資訊,我們會按照典型的使用場景來進行推薦。由於神策分析可以非常容易的支援數百萬至數千億數據規模的平滑擴容,因此我們通常會建議先用較低的設定開始部署,之後再根據系統實際的使用情況按需隨時進行調整,以最大限度的節約使用者的成本。

10. 神策分析的查詢效能是由哪些因素影響的?如何提升查詢效能?

  • A:神策分析的查詢效能,是由以下一些因素影響的:
    • 單次查詢所掃描的數據量越少,查詢會越快。需要注意的是,系統裡面儲存的總的數據量,並不會影響神策分析的查詢速度,查詢速度只與該次查詢所涉及的數據量有關。一般而言,一個時間橫跨 40 天,涉及到 6 個事件的漏斗分析,要比只橫跨 7 天,涉及 1 個事件的事件分析要慢得多。
    • 電腦的硬碟讀效能越好,查詢也會越快。在不考慮應用層 cache 的情況下,神策分析的每次查詢都需要從硬碟中掃描數據,因此,硬碟的掃描效能會直接影響查詢速度。
    • 電腦的 CPU 效能越好,查詢也會越快。一個完整的查詢,在硬碟中讀取數據以後,還需要完成一些聚合類型的計算,因此,CPU 效能越好,查詢也會越快。
    • 叢集版電腦數量越多,查詢也會越快。在其它硬件相同的情況下,電腦數量增多,相當於直接提升了硬碟的讀取以及 CPU 的計算效能,因此也會讓查詢更快。

   而如果需要提升神策分析的查詢效能,可以從以下幾種方案入手:

  • 使用抽樣查詢,減少單次查詢掃描的數據量。可以通過抽樣查詢快速發現和驗證一些問題,然後在需要的時候,再關閉抽樣取得最準確的數據。
  • 提升電腦效能。這個包括更換更好的硬碟,換更好的 CPU,以及在叢集版中直接增加電腦節點數量,對於查詢效能,都會有立竿見影的效果。