本文档所描述的内容属于神策广告分析的高级使用功能,涉及较多技术细节,适用于对相关功能有经验的用户参考。
概述
神策广告分析在神策产品体系下,提供数据自助数据导出功能,即通过 API 导出原始神策广告分析环境中的历史数据,导出的格式基于神策分析的用户、事件等格式内容,在内容上新增神策广告分析归因计算后得出的渠道信息,神策广告分析仅支持导出,不支持数据导入。具体使用步骤参考:「神策分析-历史数据导入导出」
若您为 SA 云版客户,则需要按照本文档进行数据导出,而不可使用 JDBC 方式进行数据访问。
数据导出准备
请检查您环境里事件属性、用户属性是否有「所有渠道属性说明」中的属性信息。判断方法:事件虚拟属性信息以sd_开头;用户属性则存在channel等关键字。
数据导出
数据导出方法与神策分析「神策分析-历史数据导入导出」方式一致,通过编写SQL的方式查询库中的数据,设置「format=json」进行格式化输出。
导出用户数据
参考「神策分析-历史数据导入导出」「3.1导出用户数据」
导出包含渠道属性事件数据
在导出 events 表数据时,建议通过 date 字段按天导出,这样可以提高 SQL 的查询速度。
使用 curl 导出 events 表的例子如下:
curl 'https://saasdemo.cloud.sensorsdata.cn/api/sql/query?token=******&project=default' \
-X POST \
--data-urlencode "q=SELECT sd_channel_name,sd_channel_link_id,time,distinct_id,event FROM events where sd_channel_name is NOT NULL and time > '2022-01-01 00:00:00' limit 5 /*MAX_QUERY_EXECUTION_TIME=1800*/" \
--data-urlencode "format=json" \
>> event.json
导出的数据样例:
{"distinct_id":"b7a4fda85b7818af","sd_channel_link_id":"","time":"2022-11-16 14:55:23.678","event":"pointId","sd_channel_name":"UnknownChannelOrNature"}
{"distinct_id":"b7a4fda85b7818af","sd_channel_link_id":"","time":"2022-11-16 14:55:23.732","event":"pointId","sd_channel_name":"UnknownChannelOrNature"}
{"distinct_id":"b7a4fda85b7818af","sd_channel_link_id":"","time":"2022-11-16 14:55:23.748","event":"$AppStart","sd_channel_name":"UnknownChannelOrNature"}
{"distinct_id":"b7a4fda85b7818af","sd_channel_link_id":"","time":"2022-11-16 14:55:23.784","event":"$AppViewScreen","sd_channel_name":"UnknownChannelOrNature"}
{"distinct_id":"b7a4fda85b7818af","sd_channel_link_id":"","time":"2022-11-16 14:55:35.539","event":"$AppClick","sd_channel_name":"UnknownChannelOrNature"}
导出广告归因数据
神策广告分析对于广告归因数据使用单独渠道表的方式存储,同时通过神策体系下的「虚拟属性」关联到事件表中,因此提供如下两种方式查询。
关联埋点事件查询
- 库名:rawdata
- 表名:events
- 广告归因相关数据字段:参照「神策广告分析-所有渠道属性说明」中「虚拟属性」中的sd_*相关属性
单独查询用户归因广告渠道数据
- 库名:
- 表名:custom_mutable_ads_dimension
- 广告归因相关数据字段:参照「神策广告分析-所有渠道属性说明」中「虚拟属性」中的sd_*相关属性,前缀统一改为为「p__*」
导出媒体报表中展示点击消耗报表数据
神策广告分析SaaS版现在逐步将ADP组件的功能迁移至ChannelLink组件中,客户的数据拉取导数方式也同样会迁移。导出报表展点消数据前,请先与神策对接同事确认,你的项目环境目前是否已开启ChannelLink拉数开关。若未开启,参考3.4.1节方式;若已开启,参考3.4.2节方式。
通过ADP组件拉数 (旧方式)
- 库名:
- 表名:ads_mkt_data_view
媒体报表相关数据字段如下
表字段 project_id day channel_id advertiser_id highest_id intergrade_id minimum_id time show_num click_num cost 含义 项目ID 报表日期 渠道 广告主ID 计划最高层ID
一般为广告计划ID
计划最中层ID
一般为广告组ID
计划最低层ID
一般为广告ID
报表记录所在的小时(24小时制)
当值为 -1 的时候,即表示媒体侧提供的数据是按天聚合的,最小粒度就是天
展示数 点击数 消耗数
- 特别说明
- 不同媒体的广告体系组织层级名字不一样(例如,腾讯层级为广告计划、广告组、广告,巨量引擎层级为广告组,广告计划、广告)因此采取highest_id、intergrade_id、minimum_id表示层级结构
- 媒体报表最细粒度为小时级别报表,一个小时一条记录,部分媒体只有天级别报表
- "day"字段的使用说明:
- 展示成 yyyy-MM-dd 的格式:FROM_UNIXTIME(cast(day*86400 as bigint),'yyyy-MM-dd')
- 展示成 yyyy-MM-dd HH:mm:ss 的格式:EPOCH_TO_TIMESTAMP(day* 86400)
通过ChannelLink组件拉数 (新方式)
- 库名:ads_dataflow_{项目名}
- 表名:ads_mkt_data_view
- 字段:上表中,去掉了project_id字段,其他完全一致