指标和维度

3
g
g
GW
Last updated 2 days ago

预定义维度和指标的基本解释

1. 指标

1.1 如何区分 PV 和 UV?

PV 即 Pageview 表示访问了多少页面,UV 是 unique visitor 独立访客,GrowingIO是以一段时间内访问您网站的所有用户去重得到的独立用户数量来做计算的。

1.2 访问用户和登录用户有什么区别?

访问用户是基于浏览器 cookie 或者移动设备 ID 等具有唯一标识性的 ID 信息计算的;登录用户是根据用户上传的信息来计算的。

1.3 为什么一个页面的位置相近的元素,浏览量会有很大的差距?

造成数据差异的原因有如下:

  • 不同的页面结构,造成了一些元素有着变动的 id。按照某个固定id的方式统计元素的 impression 和 click 会低于元素的实际访问数据;我们开发了智能化识别算法,利用模糊查询,进行更精确的数据统计;

  • 有些元素不是对所有用户呈现的,比如表征用户等级的『皇冠』,对于没有达到该等级的用户看不到该元素;所以会导致该元素的 impression 量低于一直展示的其他元素。

1.4 为什么我页面的 PV 会大于页面上元素的浏览量?

可能有以下几个原因:

  1. 有些元素不是对所有用户呈现的,比如表征用户等级的『皇冠』,对于没有达到该等级的用户看不到该元素;

  2. 用户未访问该元素:有些元素没来得及渲染用户已经离开了当前页面;

  3. IE8 及以下的 IE 浏览器版本 GrowingIO 不收集 impression;

  4. 在一个加载完成的页面上,用户进行某个交互操作而页面不重新渲染,这时会触发一次 PV,而页面上元素 impression 不会 +1。

1.5 为什么页面的访问量,没有页面按钮的访问量高?

可能有以下几个原因: 1.圈选元素的时候页面选择的是全站页面,就是说按钮的定义是跨页面的; 2.有可能那个按钮可以由于交互操作被多次显示 ; 3.圈选元素的时候关掉了文本,链接。

1.6 为什么新用户数量为什么占比这么高?

GrowingIO 从集成代码后开始获取用户数据,因此在刚刚集成代码的几天会统计到大量的新用户。建议您在统计一段时间后再参考新用户数据。

1.7 访问用户量和新访问用户量,登录用户量和新登录用户量的区别?

什么是访问用户和登陆用户,看这里。新登陆用户和新访问用户的统计口径,看这里

注意:

  • 您需要上传用户属性字段来统计登录用户数量。

  • 刚刚上传的字段,因为是首次出现在 GrowingIO 系统中因此会判断为新登录用户。

1.8 其他几种不同的用户量统计类型?

  • 浏览访问用户量:浏览过某个元素的去重后访问用户数量;

  • 点击访问用户量:点击过某个元素的去重后访问用户数量;

  • 浏览登录用户量:浏览过某个元素的去重后登录用户数量;

  • 点击登录用户量:点击过某个元素的去重后登录用户数量。

1.9 跳出率可以看实时的吗?我现在看昨天和今天的跳出率都是0,不知道什么原因?

跳出率的单位是整天,时间选择昨天的话,颗粒度默认为小时,所以是没数的。如果您想看昨天的数据,请在过去7天里查看昨天的跳出率。

1.10 如果我想知道访问深度,应该用哪些指标?

您可以使用访问时长和每次会话浏览页数来衡量用户的访问深度。

1.13 有哪些常用的复合指标?计算公式是怎样的?

常用的指标有转化率,平均按钮点击量,活跃度等等。

注册转化率: 若您想了解你的注册转化率,我们可以定义分子为注册成功页面的 PV,分母为注册入口的“立即注册”按钮点击量。

平均按钮点击量: 比如您想了解“购买按钮“的人均点击量。理论上人均应该点击一次购买按钮,但是因为 bug,或者流程设计不规范等原因,用户要点击多次按钮才能完成购买,您可以将分子定义为这个按钮的点击量,分母定义为这个按钮的点击人数。

统计产品功能的活跃度: 比如您想了解用户使用某一功能的情况:用户要想完整的体验一个功能需要点击 ABC 三个按钮。这时候您只需要将这三个按钮的点击量相加即可。

复合指标制作请看这里

2. 维度

2.1 访问来源和一级访问来源怎样使用?

访问来源可以帮助您了解该网站流量来源,访问来源可以是百度,谷歌,优酷等站外渠道,也可能是直接访问该网站。您可以通过访问来源维度查看不同来源的流量质量;

一级访问来源将访问来源进行了细分:一级访问来源将访问来源分为直接访问,搜索引擎,社交媒体,外部链接四大部分,方便您更方便地对来源归类,分析不同来源的流量效果。

2.2 如果我想区分手机访问的用户和电脑访问的用户,我应该用哪个维度?

您可以通过「操作系统」来区分。

2.3 城市和地区的判断原理是什么?什么场景使用哪个维度?

判断原理: GrowingIO 使用 IP 地址来判断用户来自的城市或者地区。城市或者地区判断为「未知」的原因:可能是用户使用移动网络,或开了代理。

使用场景: 如果你关注的是一线城市,二线城市等城市级别的分布,建议使用城市维度;如果你关注的是省份,可以使用地区维度。没有特殊要求时,建议使用地区维度。

2.4 监控付费推广(渠道来源)的 UTM,对应到维度这里是哪些,怎样使用?

相关维度: UTM 参数现在有,广告来源(utm_source),广告媒介(utm_medium ),广告关键字(utm_term ),广告内容(utm_content )。您可以参考如下文章去配置 UTM 渠道追踪。我们建议你可以使用广告监测功能。

使用场景: UTM 广告系列参数对着陆页面的 URL 进行标注,可以区别衡量各种营销渠道所带来的访客价值。在这里渠道归因采取的是非直接访问的最后点击模型。 比如,访客于 9:30 访问网站。我们进行渠道归因时,会统计在 10:00 点开始,回溯 30 天时间,其最后一次通过外站(非直接流量)进来时的 UTM 参数,关键词和 refer URL。举个例子,访客 A 通过百度推广进入网站,然后通过新浪的 banner 再次进入网站,最后一次通过直接输入 URL 进入网站完成购买,我们会认为这次转化由新浪 banner 贡献。

2.5 城市维度为什么有未知?

我们使用 IP 地址来判断用户来自的城市或者地区。城市或者地区判断为「未知」的原因可能是由于 3g/4g 下运营商的限制,IP 只能解析到地区级别,所以城市会出现「未知」。

2.6 维度筛选中 in,not in,=,≠ 什么含义?

  • in:满足多个维度条件中任意一条;

  • not in:不满足多个维度条件中的任意一条;

  • =:满足特定的某一个维度条件;

  • ≠:不满足特定的某一个维度条件。

2.7 “超出维度行数上限”是什么意思?

我们使用维度和指标来进行数据分析。维度用来决定一个分析的角度,指标用来展现这个角度的数据。例如,我们可以使用“网站/手机应用”作为维度,页面浏览量作为指标,在 GrowingIO 中制作出下面这张表:

此处输入图片的描述

“网站/手机应用”维度一共有四个值,分别是:Web、iOS、Android、minP,右边的这几行数值分别代表这四个平台的访问量指标。

维度就像一个集合,其中存放的是从某个角度分析的描述性字符串。集合论中有一个重要的概念,叫做“基数”,描述的就是集合中元素的个数。在上面的这个例子中,我们使用的“网站/手机应用”维度有三个值,分别是“Web、iOS、Android”。在这个情况下,我们可以称这个维度的“基数”为 3。不难想到,在 GrowingIO 系统中,有些维度的基数是很大的,例如页面维度。很多电子商务类型的网站,产品详情页 URL 会是类似于:http:// item.ecommerce.com/{productId}.html。那么如果这个网站有 N 个商品有页面浏览(至少一次页面浏览),页面这个维度的基数就是 N,可见这个时候 N 的值是非常巨大的。 GrowingIO 系统为了更加专注资源在用户关注的页面或者事件上,引入了处理“巨大基数维度“(High Cardinality Dimensions)”算法来区别对待产生巨大流量页面、事件和长尾的页面、事件。

以页面维度为例,算法细节如下: 以天作为一个计算单位,天级别的数据中包含的不同的值如果低于 2000,则正常计算所有的页面,这些所有的页面都会作为“页面”维度的维度值展示在报表中。

当天级别的数据中页面维度的不同的值超过 2000 时,系统自动进入“巨大基数维度”的整理模式。

在整理模式中,每当添加一个新的值到页面维度中,系统会自动计算出当前页面浏览量总数的前 95% 的维度的值按照从大到小排序的位置编号值,假设为 x。如果 x 小于 5000,则页面维度的不同的值保留到该位置为止,剩下的维度值和相应的指标数值合并到一个称为“超出维度行数上限”的行中。如果 x 大于 5000,则按照页面浏览量数值大小,取前 5000 行,剩下的维度值和相应的指标数值合并到一个称为“超出维度行数上限”的行中。