神策分析帮助中心 技术指南 高级功能 Current: 数据归档 数据归档 | 收藏 1. 数据归档数据归档,也叫冷数据转储,是指把一些过老的,访问次数很低的数据迁移归档(转储)到廉价的存储系统里,如 Amazon S3。神策分析在 1.14 版本开始提供数据归档功能,为客户减少使用成本。1.1. 什么时候需要数据归档当满足如下条件时,可进行数据归档:当用户使用了较长时间的神策服务,集群中存储的数据越来越多,需要定期扩大集群的存储大小当用户使用了较长时间的神策服务,对于过老的数据,访问次数较低1.2. 数据归档预期效果进行数据归档之后,会有如下的预期效果:大量旧数据会存储在更低廉的存储系统,降低使用成本。转储之后不影响旧数据的查询,但查询速度会比存储在原集群中会慢一些。已进行数据归档的日期不可再进行导入。1.3. 前期了解目前,数据归档提供三种不同存储协议:协议说明使用场景hdfs://hadoop 集群文件系统若有廉价的 hdfs 存储环境,可使用此协议进行数据归档s3a://Amazon S3 云存储若通过直接创建 Amazon S3 bucket 的形式建立归档文件服务器file://公有云全托管式 POSIX 分布式文件系统,如 JuiceFS可以基于任意公有云(包含 AWS) 建立归档文件服务参考文档:Amazon S3 官方文档JuiceFs 官方文档1.4. 开启功能开启数据归档功能,请联系神策技术支持,神策技术团队会给出最合理的归档方案,并开启归档服务。1.5. 如何删除已归档数据如需要将已归档的数据清除,不能在 nas 盘直接删除,需要使用 数据清理工具。 删除命令不能指定事件名,否则删除数据会报错。历史归档数据删除后,已删除的数据不可再查询,且神策分析中上线至今对应的开始的日期也会自动调整。 注:本文档内容为神策产品使用和技术细节说明文档,不包含适销类条款;具体企业采购产品和技术服务内容,以商业采购合同为准。