数据导入管理

客户数据平台-数据集成,新建和管理数据导入任务

简介

通过SDK或者其他方式产生的用户相关历史数据,进行处理加工成固定的格式后,通过创建数据导入任务的方式将历史用户产生的数据导入CDP系统中,数据上传成功即可在其他分析模块进行用户行为的分析

功能边界或约束

创建相应类型的数据源,使用说明请参考数据源管理

需要有该模块的权限,如无权限请找管理员开通

数据导入用户行为数据:预置事件(如$visit、$page等)、预置事件属性($domain、$city、$ip等等)范围格式

用户属性:预置用户属性范围及格式详见用户管理

功能说明

创建数据导入任务

在导航栏选择“ 数据集成 > 数据导入管理“,进入数据导入管理页面

数据导入管理页面

点击创建数据导入任务按钮

数据导入类型选择

选择数据导入类型,用户行为数据用户属性数据

用户行为数据

用户行为数据

选择数据源:选择在数据源管理中创建的数据源,如果是事件数据创建用户行为类的数据源,如是用户属性则选择用户属性类数据源。

选择时间范围:数据所覆盖的所有时间,例如需要导入的数据涵盖2020年1月1日~2020年4月1日,则选择时间2020年1月1日至2020年4月1日即可。

选择上传方式:CSVJSON、FTP

用户属性数据

用户属性数据

选择数据源:选择用户属性类型的数据源

选择上传方式:CSVJSON、FTP

确定创建任务

上传数据,将按照固定数据格式导入CDP

选择CSV进入页面

上传CSV页面

选择JSON

上传JSON页面

选择FTP:提供任务目录地址,将JSON文件放入FTP目录中,格式参考数据格式JSON。将数据放入指定FTP目录,点击“操作”,查看文件上传,勾选注意事项,进行下一步

FTP方式,未上传数据时状态

上传数据成功后,开始导入

查看任务详情

主页点击某一任务,弹出任务详情信息栏,还未导入的任务可通过右上角的“上传文件”按钮,进入导入页面

任务详情

查看导入状态

还未导入:任务还未开始

正在导入:任务正在队列中等待进行或任务已经启动

导入成功:数据已进入系统中

导入失败:点击“操作”列查看错误详情

数据导入管理页面
FTP方式,导入失败状态

数据导入格式

用户行为数据(CSV格式)

固定列名

数据类型

描述

第一列

userId

字符串

必填,用户的登录ID

第二列

event

字符串

必填,系统内已定义的事件标识符

第三列

timestamp

字符串

必填,支持格式2021-07-01 00:00:00.000、2021-07-01、2021-07-01 00:00:00、秒级时间戳(1630379476)、毫秒级时间戳(1630379476000)、2021/07/01 00:00:00.000、2021/07/01、2021/07/01 00:00:00

已定义事件与事件属性绑定关系:

事件标识符

事件属性标识符

batchi0809

batch10809,batch20809

batchi0810

batch20809,batch30809

batchi0811

batch30809

数据样例:

userId

event

timestamp

batch10809

batch20809

batch30809

123321

batchi0809

2021-07-01

绑定0809

绑定0809

123321

batchi0809

2021-07-02

绑定0809

绑定0809

123321

batchi0810

2021-07-03

绑定0810

绑定0810

123321

batchi0811

2021-07-04

绑定0811

用户行为数据(JSON格式)

字段名

类型

描述

userId

String

必填,登录用户 id

event

String

必填,事件标识,​需提前在数据管理中创建,预定义属性请在事件管理-预定义属性中查看相应属性的key标识

timestamp

Long

必填,事件发生 unix 毫秒时间戳

attrs

Map<String, String>

可不填,事件属性,其中属性的 key ​需要提前在数据管理中创建​并关联

数据样例:

{​"event"​:​ ​"paySuccess"​,​ ​"userId"​:​ "​156xxx"​,​ ​"timestamp"​:​ ​1577246696001​,​ ​"attrs"​:​ ​{​"type"​: "Wechat"​}}
{​"event"​:​ ​"paySuccess"​,​ ​"userId"​:​ "​156xxx"​,​ ​"timestamp"​:​ ​1577246696002​,​ ​"attrs"​:​ ​{​"type"​: "Wechat"​}}
{​"event"​:​ ​"paySuccess"​,​ ​"userId"​:​ "​157xxx"​,​ ​"timestamp"​:​ ​1577246696001​,​ ​"attrs"​:​ ​{​"type"​: "Wechat"​}}
{​"event"​:​ ​"paySuccess2"​,​ ​"userId"​:​ ​"158xxx"​,​ ​"timestamp"​:​ ​1577246696003​,​ ​"attrs"​:​ ​{​"type"​: "Wechat"​}}

用户属性(CSV格式)

固定列名

描述

第一列

userId

必填,登录用户ID

第二列

用户属性...

系统已定义的用户属性

...

...

数据样例:

userId

sex

age

test1

123

19

初级

234

38

中级

345

22

高级

用户属性(JSON格式)

字段名

类型

描述

userId

String

必填,登录用户 id

attrs

Map<String, String>

必填,用户属性,其中属性的 key ​需要提前在 “数据管理 -> 用户属性“ 中创建​并关联

数据样例:

{"userId": "156xxx", "attrs": {"sex": "男", "age": "16"}}
{"userId": "157xxx", "attrs": {"sex": "女", "age": "28"}}

支持导入预置事件、属性、用户属性明细表

预置事件

预置事件标识符

描述

$visit

用户访问一次页面

$page

页面浏览

预置事件属性

预置事件属性

类型

描述

$session

String

会话ID

$package

String

包名(App专用)

$platform

String

应用平台端

$referrer_domain

String

访问来源

$utm_source

String

广告来源

$utm_medium

String

广告媒介

$utm_campaign

String

广告名称

$utm_term

String

广告关键字

$utm_content

String

广告内容

$ads_id

String

广告id

$key_word

String

搜索词

$country_code

String

国家代码

$country_name

String

国家名称

$region

String

地区

$city

String

城市

$browser

String

浏览器

$browser_version

String

浏览器版本

$os

String

操作系统

$os_version

String

操作系统版本

$client_version

String

App版本

$channel

String

自定义 App 渠道

$device_brand

String

设备品牌

$device_model

String

设备型号

$device_type

String

设备类型

$device_orientation

String

设备方向

$resolution

String

屏幕大小(高*宽)

$language

String

操作系统语言

$referrer_type

String

一级访问来源

$account_id

String

ai/项目id

$domain

String

域名

$ip

String

Ip

$user_agent

String

用户代理

$sdk_version

String

sdk版本

$location_latitude

Float64

纬度

$location_longitude

Float64

经度

$path

String

页面

$referrer_path

String

页面来源

$textValue

String

元素内容

$index

String

元素位置

$xpath

String

元素路径

$hyperlink

String

元素链接

预置用户属性

详见用户管理模块

特殊用户属性说明

用户属性

标识符

说明

出生年月日

$basic_birthday

日期,格式:yyyy-MM-dd

性别

$basic_gender

字符串,枚举值:UNKNOWN,MALE,FEMALE

地址

$basic_addresses

list格式,用英文逗号分隔,例如:中国,北京,朝阳区

注册时间

$basic_createdAt

时间戳格式(毫秒级),默认值false

关注公众号

$wechat_subscribeList

list格式,用英文逗号分隔 ,例如:GrowingIO,易数

支付宝学生认证

$alipay_isStudentCertified

boolean类型(true或false),默认值false

支付宝实名认证

$alipay_isCertified

boolean类型(true或false),默认值false

数据导入限制

  1. 数据格式为 json,每条记录单独一行,用换行符分割

  2. 建议单个数据文件为256MB,可以支持多个文件的上传

  3. 暂时不支持压缩的文件,请上传原始数据

  4. 历史数据会按天分组导入。对于用户行为数据同一个事件重复导入会覆盖,并且会覆盖历史 SDK 打点的数据。对于用户属性数据会和历史数据做合并,T+1生效。