原始数据导出为付费功能,且只能导出从开通之日起的原始数据,原始数据仅保留15天,请定期下载。数据导出一般延迟为 30 分钟,比如早上 8 点到 9 点之间的数据,一般 9:30 会准备好。每天凌晨因为需要运行天级别的统计任务,所以导出任务会延迟 1-2 小时,在导出数据时请判断 status
字段 。
导出时数据以每 64M 为单位分包发送,导出数据默认采用 gzip 压缩。原始数据中所有时间字段均为 UTC 时间,并非中国时间;此处导出的压缩包名也是由 UTC 时间命名。
在进行原始数据导出之前,请务必参考 “GrowingIO接口认证”文档,完成接口认证获取 token 。
“2.0版”提供了小时级别的原始数据导出。
例如,下午1点到2点的原始数据,在一般情况下可以在3点准备好。
“2.0版”在包含所有“1.0版”具有的数据表和字段的基础上添加了数据主版本2.0(SDK 2.x)版本具有的自定义事件和变量的数据表和字段,并对包括广告监测数据导出在内的所有数据导出表的字段做了统一处理。
“2.0版”兼容并包含了"1.0版"的所有数据字段。
{"status": "","downloadLinks": [],"exportType": "","dataType": "","exportDate": "","exportVersion": "","requestTime": "","errorMsg": ""}
{"status": "FINISHED","downloadLinks": {"evar": [],"pvar": [],"action_tag": [],"custom_event": [],"page": [],"ads_track_activation": [],"visit": [],"ads_track_click": [],"action": []},"exportType": "hour","exportDate": "2018070100","exportVersion": "v2","requestTime": "2018-07-18 02:37","errorMsg": ""}
返回结果中的字段含义为:
status 表示导出状态,可能值为:
FINISHED:导出任务完成,客户可以使用 downloadLinks 中的链接进行文件下载
RUNNING:导出任务正在运行
NOT_EXISTS:导出任务不存在,请检查是否开启了导出功能并检查请求日期时间
ERROR:导出任务发生错误
downloadLinks 表示文件的下载链接,key为数据类型,参考: 原始数据导出字段说明
链接可能随时调整,不应使用链接中任何内容作为处理程序依据,链接默认过期时间为五分钟
exportType 表示导出任务类型,由用户传入,服务器原样返回
dataType 表示导出数据类型,由用户传入,服务器原样返回
exportDate 表示导出数据时间,由用户传入,服务器根据 exportType 截取后返回
exportVersion 表示导出数据版本,当前版本下默认为 v2
requestTime 客户请求发生时服务器时间
errorMsg 当请求发生错误时,服务器返回的错误信息
在“原始数据导出 2.0 API” 上线之前,使用数据主版本2的客户也在使用“原始数据导出 1.0 API”。在“原始数据导出 1.0 API”版本中并没有包括如:页面级变量、转化变量这样的原始数据。在“原始数据导出 2.0 API”中提供了这部分原始数据的导出功能。