概述
在入库校验规则设置中,我们对事件、事件属性、用户属性的入库规则提供了明细说明,并且支持设置 ip、域名黑名单来过滤特定 ip、域名的数据,从而避免刷量数据对于数据分析或者事件量的影响。为了减少用户在数据上报错误后的修正成本,对于部分类型的属性,神策系统在入库时,如果发现与要求的属性类型不一致的时候,会采取自动转换的功能。
IP 及域名黑名单设置
为了避免恶意刷量数据对数据分析和事件量的影响,我们支持了设置 ip 或者域名黑名单的方式来进行数据过滤。
添加黑名单
点击IP 或域名黑名单区域右侧的「编辑」按钮,在弹窗中输入 ip 或者域名的值,注意每行输入一个值。
若需要删除已经添加的黑名单,重新点击「编辑」,将对应的值删掉保存即可。
注意:设置域名黑名单时,是按照「完全匹配」来进行拦截的,如果在此处设置的是一级域名,但实际数据中上报的是二级域名,此时是不会拦截数据的。
打开开关
添加了需要进行过滤的 ip 或者域名黑名单后,需要开启左上角的开关才能生效。开启开关后,数据过滤实时生效,但不对历史数据进行回溯过滤。
查看过滤数据
如果您想要查看被 ip或域名黑名单过滤的数据,您可以进入「埋点数据查询」中查看,错误分类为「IP 及域名黑名单过滤」即此部分被过滤的数据。
用户属性入库设置
该功能模块暂不支持 IDM 3.0 版本,如有疑问请联系神策同学
为了确保有效用户数据的上报,你可以在此模块对「设备 ID」和「登录 ID」用户信息格式规则进行自定义。无论你的项目是否开启了「数据强校验模式」均可使用此功能。
注:强烈建议修改时,务必联系神策同学协助确认规则,从而确保规则的准确性,避免数据无法入库。
用户信息格式规则需要以正则表达式的方式进行设置,神策为用户提供了各端「设备 ID」正则表达式的常用规则。在设置的时候可以直接勾选使用,如果存在此规则无法覆盖的情况,请自定义调整。如果某些端不需要采集,那么依然可以选择为「不设置」。
对于「登录 ID」因各家产品的 ID 规则不同,此处需要你自己使用正则表达式来定义「格式规则」,可参考此文档进行正则表达式的编写,确定规则后,请联系神策同学协助你确认正则表达式的正确性。如当前项目中存在多个产品,其「登录 ID」格式规则各不相同,请务必在正则表达式中以「或」的关系写入,如果只描述了一个组规则,有可能造成其他产品的用户数据无法正常入库。