菜单

用户&事件&广告数据导出 Pull API

本文档所描述的内容属于神策广告分析的高级使用功能,涉及较多技术细节,适用于对相关功能有经验的用户参考。

概述

神策广告分析在神策产品体系下,提供数据自助数据导出功能,即通过 API 导出原始神策广告分析环境中的历史数据,导出的格式基于神策分析的用户、事件等格式内容,在内容上新增神策广告分析归因计算后得出的渠道信息,神策广告分析仅支持导出,不支持数据导入。具体使用步骤参考:神策分析-历史数据导入导出

若您为 SA 云版客户,则需要按照本文档进行数据导出,而不可使用 JDBC 方式进行数据访问。

数据导出准备

请检查您环境里事件属性、用户属性是否有所有渠道属性说明中的属性信息。判断方法:事件虚拟属性信息以sd_开头;用户属性则存在channel等关键字

 数据导出

数据导出方法与神策分析神策分析-历史数据导入导出方式一致,通过编写SQL的方式查询库中的数据,设置format=json进行格式化输出。

导出用户数据

参考神策分析-历史数据导入导出3.1导出用户数据

导出包含渠道属性事件数据

在导出 events 表数据时,建议通过 date 字段按天导出,这样可以提高 SQL 的查询速度。

使用 curl 导出 events 表的例子如下:

curl 'https://saasdemo.cloud.sensorsdata.cn/api/sql/query?token=******&project=default' \
-X POST \
--data-urlencode "q=SELECT sd_channel_name,sd_channel_link_id,time,distinct_id,event FROM events where sd_channel_name is NOT NULL and  time > '2022-01-01 00:00:00' limit 5 /*MAX_QUERY_EXECUTION_TIME=1800*/" \
--data-urlencode "format=json" \
>> event.json

导出的数据样例:

{"distinct_id":"b7a4fda85b7818af","sd_channel_link_id":"","time":"2022-11-16 14:55:23.678","event":"pointId","sd_channel_name":"UnknownChannelOrNature"}
{"distinct_id":"b7a4fda85b7818af","sd_channel_link_id":"","time":"2022-11-16 14:55:23.732","event":"pointId","sd_channel_name":"UnknownChannelOrNature"}
{"distinct_id":"b7a4fda85b7818af","sd_channel_link_id":"","time":"2022-11-16 14:55:23.748","event":"$AppStart","sd_channel_name":"UnknownChannelOrNature"}
{"distinct_id":"b7a4fda85b7818af","sd_channel_link_id":"","time":"2022-11-16 14:55:23.784","event":"$AppViewScreen","sd_channel_name":"UnknownChannelOrNature"}
{"distinct_id":"b7a4fda85b7818af","sd_channel_link_id":"","time":"2022-11-16 14:55:35.539","event":"$AppClick","sd_channel_name":"UnknownChannelOrNature"}

导出广告归因数据

神策广告分析对于广告归因数据使用单独渠道表的方式存储,同时通过神策体系下的「虚拟属性」关联到事件表中,因此提供如下两种方式查询。

关联埋点事件查询

单独查询用户归因广告渠道数据

导出媒体报表中展示点击消耗报表数据

神策广告分析SaaS版现在逐步将ADP组件的功能迁移至ChannelLink组件中,客户的数据拉取导数方式也同样会迁移。导出报表展点消数据前,请先与神策对接同事确认,你的项目环境目前是否已开启ChannelLink拉数开关。若未开启,参考3.4.1节方式;若已开启,参考3.4.2节方式。

通过ADP组件拉数 (旧方式)

  • 库名:rawdata
  • 表名:ads_mkt_data_view
  • 媒体报表相关数据字段如下

    表字段project_iddaychannel_idadvertiser_idhighest_idintergrade_idminimum_idtimeshow_numclick_numcost
    含义项目ID报表日期渠道广告主ID

    计划最高层ID

    一般为广告计划ID

    计划最中层ID

    一般为广告组ID

    计划最低层ID

    一般为广告ID

    报表记录所在的小时(24小时制)

    当值为 -1 的时候,即表示媒体侧提供的数据是按天聚合的,最小粒度就是天

    展示数点击数

    消耗数

  • 特别说明
    • 不同媒体的广告体系组织层级名字不一样(例如,腾讯层级为广告计划、广告组、广告,巨量引擎层级为广告组,广告计划、广告)因此采取highest_id、intergrade_id、minimum_id表示层级结构
    • 媒体报表最细粒度为小时级别报表,一个小时一条记录,部分媒体只有天级别报表
    • "day"字段的使用说明:
      • 展示成 yyyy-MM-dd 的格式:FROM_UNIXTIME(cast(day*86400 as bigint),'yyyy-MM-dd') 
      • 展示成 yyyy-MM-dd HH:mm:ss 的格式:EPOCH_TO_TIMESTAMP(day* 86400) 

通过ChannelLink组件拉数 (新方式)

  • 库名:ads_dataflow_{项目名}
  • 表名:ads_mkt_data_view
  • 字段:上表中,去掉了project_id字段,其他完全一致
上一个
使用 JDBC 进行数据访问
下一个
归因数据订阅 Push API
最近修改: 2024-12-27