# 留存分析

留存，是指用户在 APP、网站等应用上使用过，并一段时间后仍有使用。

留存分析模型是一种衡量用户健康度/参与度的方法，超越下载量、DAU 等指标，深入了解用户的留存和流失状况，发现影响产品可持续增长的关键因素，指导市场决策、产品改进、提升用户价值等。

## 留存分析能解决哪些问题？

1. 上个月做了一次产品迭代，如何评估其效果？是否完成了产品经理期望完成的行为？
2. 作为一个社交 APP，在注册后不添加好友和添加 10 个好友的用户后续留存有差异吗？
3. 短期留存低，长期留存一定很差吗？
4. 两个推广渠道带来不同的用户，哪个渠道的用户更有可能是的高价值用户？
5. 近 30 天注册的用户，半个月都没有回访的用户比例是多少？

   ……

![](https://2207941107-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LaKVSdcX30MGZ24jKF_%2F-LvOxpyQyw9qAIx4ozvr%2F-LvOyGS00rFW-ksup1Q9%2Fimage.png?alt=media\&token=e44e143e-c100-4442-83b4-1eec8f76a1ce)

## 1. 定义指标

上方为指标定义区域，定义留存条件，指标定义、细分维度查看，支持条件过滤，支持多个人群的对比分析，支持对全量数据随机抽样计算。

### 1.1 定义留存

留存是基于某个用户群体的初始行为时间来计算的，描述发生了某个行为的同期群，在一段时间后是否发生了期望的行为。

初始行为和后续行为均可以是任意事件或者某个具体的事件

![](https://2207941107-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LaKVSdcX30MGZ24jKF_%2F-MHu8Hdl0TJe9LgqtAfR%2F-MHuKdG_kgRee2k35cWM%2Fimage.png?alt=media\&token=7ce3a141-5d94-45f5-b60e-102b0a6dd123)

**通常的三类留存可以这样来构建：**

#### **A. 新增用户留存**

**移动端：** 选择条件【初始行为 = 启动，后续行为 = 启动】，分群=新访问用户，即可分析新访用户的留存情况

**H5/Web/小程序：** 选择条件【初始行为 = 浏览页面，后续行为 = 浏览页面】，分群=新访问用户，即可分析新访用户的留存情况

{% hint style="info" %}
同样也可以根据业务需求，自定义新增用户
{% endhint %}

#### **B. 活跃用户留存**

**移动端：** 选择条件【初始行为 = 启动，回访行为 = 启动】，分群=所有用户，即可分析活跃的用户后续使用应用的情况

**H5/Web/小程序：** 选择条件【初始行为 = 浏览页面，回访行为 = 浏览页面】，分群=所有用户，即可分析用户活跃的用户在后续访问网站的情况

#### **C. 自定义留存**

相较分析新增/活跃用户的总体留存情况，关注业务的核心事件使用情况，会更有利于发现用户的行为模式和其中可能存在的问题。

> e.g. 对于电商的运营，可以定义【 初始行为 = 支付订单，后续行为 = 支付订单】 了解用户的复购行为，多长时间会产生复购，可以进一步分析这些忠实用户的行为特征；

> 对于问答应用，可以定义【初始行为 = 注册 ，回访行为 = 评论 】，了解用户在注册后有多少用户在多长的频率里会参与进来。

**不同的分析场景中可以设置多个不同的留存条件来分析：**

**初始行为和后续行为设置为相同**，对比不同的功能，重复发生的情况，发现用户对不同功能的使用粘性；

**初始行为相同，设置不同的后续行为**，对比同一个优化，是否对其他功能有不同的影响；

**后续行为相同，设置不同的初始行为**，对比发现不同的运营手段、产品功能对核心业务目标的影响。

{% hint style="info" %}
V5.1 及以上版本初始行为和后续行为支持选择多个，比如分析使用A功能或者B功能的用户后续回访的用户，可以通过设定以下条件来查询

初始行为：点击A功能 或 点击B功能

后续行为：启动
{% endhint %}

![](https://2207941107-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LaKVSdcX30MGZ24jKF_%2F-MHu8Hdl0TJe9LgqtAfR%2F-MHuQp-lrquRd3vwjNDu%2Fimage.png?alt=media\&token=0f567649-fd1f-4d32-b4c2-f114456d4133)

### 1.2 筛选条件

可以增加某个行为的条件约束，查看满足这些条件下的用户行为，

e.g.对于电商运营，可以查看具体某个品类的复购情况，【初始行为 = 支付订单，商品品类 = 3C；后续行为 = 支付订单，商品品类 = 3C】。

### 1.3 指标切换

可查看第 N 日/之后连续 N 日的留存/流失用户

| 指标                     | 说明文案                                                                                                    |
| ---------------------- | ------------------------------------------------------------------------------------------------------- |
| 第 N 日 - 留存用户数 和 留存率    | <p>在某一日/周/月发生了初始行为的用户在第 N 日/周/月时发生了后续行为的用户记为留存用户</p><p>留存率是指第 N 日/周/月时发生了后续行为的留存用户在初始行为用户中的占比</p>       |
| 第 N 日 - 流失用户数 和 流失率    | <p>在某一日/周/月发生了初始行为的用户在第 N 日/周/月时没有发生后续行为的用户记为流失用户</p><p>流失率是指第 N 日/周/月时流失的用户在初始行为用户中的占比</p>             |
| 之后连续 N 日 - 留存用户数 和 留存率 | <p>在某一日/周/月发生了初始行为的用户在之后连续 N 日/周/月发生了后续行为的用户记为留存用户</p><p>留存率是指之后连续 N 日/周/月发生了后续行为的留存用户在初始行为用户中的占比</p>   |
| 之后连续 N 日 - 流失用户数 和 流失率 | <p>在某一日/周/月发生了初始行为的用户在之后连续 N 日/周/月没有发生后续行为的用户记为流失用户</p><p>流失率是指之后连续 N 日/周/月没有发生后续行为的流失用户在初始行为用户中的占比</p> |
| 同时分析指标                 | 可以同时分析留存用户在每个周期里的指定指标的表现，比如选择【初始行为：支付订单】【后续行为：支付订单】【同时分析指标：支付订单的金额】即可分析回购用户的回购金额                        |

### 1.4 细分维度

支持同时查看某个维度不同属性值的留存，比如不同城市的新用户留存，细分发现影响留存的特定因素。

对于不同属性值类型支持不同的分组方式，同《[事件分析 - 1.3 细分维度](https://arkdocs.analysys.cn/features/event#13-xi-fen-wei-du)》

### 1.5 人群选择

默认基于所有用户计算留存，可以选择其他已保存人群，e.g.要分析北京地区用户留存，选择北京地区的用户即可。也可点击对比分群，选择对应的人群进行对比分析。

## 2. 图表展示

图表展示区，可以选择时间范围、时间粒度、

### 2.1 时间范围

**时间范围限制的是初始行为发生的日期**

e.g 选择了【2018/03/01-2018/03/07】【初始行为 = 注册，后续行为 = 任意事件】则计算的是在2018/03/01-2018/03/07这段时间里，每一天注册的用户，在随后30天里再次回访的留存用户。

### 2.2 时间粒度

可选择的时间粒度，包括：

* **按日**，可分别查看次日、7日、14日及 30日留存
* **按周**，可分别查看次周、8周、12周及 24周留存
* **按月**，可分别查看次月、6月、12月及 24月留存

### 2.3 第 N 日留存/流失

**第 N 日留存用户数**指在某个时间发生了初始行为 X 的用户，在之后的第 N 日/周/月进行了后续行为 Y 的用户（ X 可以等于 Y ）。

例如：

> 初始行为 = 点击购买
>
> 后续行为 = 点击购买
>
> 4月1日发生购买的用户200人，这200人中4月2日再次购买的用户有100人，4月4日再次购买的用户有50人，
>
> 则第1日留存用户为100，第3日留存用户为50。

**第 N 日流失用户数**指在某个时间发生了初始行为 X 的用户，在之后的第 N 日/周/月没有进行后续行为 Y 的用户（ X 可以等于 Y ）。

例如：

> 初始行为 = 点击购买
>
> 后续行为 = 点击购买
>
> 4月1日发生购买的用户200人，这200人中4月2日没有购买的用户有100人，4月4日仍然没有购买的用户有50人，
>
> 则第1日流失用户为100，第3日流失用户为50。

**基础计算规则**

假设定义初始行为是 X 事件，回访行为是 Y 事件。

2017/03/01-2017/03/08 小明各天的行为序列为：

| 2017/3/1 | 2017/3/2 | 2017/3/3 | 2017/3/4 | 2017/3/5 | 2017/3/6 | 2017/3/7 | 2017/3/8 |
| -------- | -------- | -------- | -------- | -------- | -------- | -------- | -------- |
| XYXY     | ABC      | YCX      | DDY      | ABC      | BYC      | ABC      | DDY      |

那么计算 2017/03/01的7日留存，则需要在3月1日之后加上7日，查找2017/03/01-2017/03/08范围内，是否发生了后续行为 Y 事件，小明会被算作第2日、第3日、第5日、第7日的留存；则第1日、第4日、第6日被算作流失。

但是若细分维度时，会略有差异，分别说明提供的两类细分维度：

**用户属性：** 根据用户属性来分组，e.g. 性别，如果小明是男，则会被算到男性用户的留存当中

**事件属性：** 根据初始行为的事件属性分组。如果用户触发了多次初始行为，并且属性值不相同，会按用户首次初始行为的属性值进行分组，e.g. 设备品牌，如果小明3月1日方开始用 iPhone X 点击了XY，随后更换了华为 Mate8 又点击了 XY 事件，则小明会被算到 iPhone X 的分组中。

可以对比不同人群的留存，探索发现影响留存/流失的原因

![](https://2207941107-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LaKVSdcX30MGZ24jKF_%2F-MHu8Hdl0TJe9LgqtAfR%2F-MHuY9O2gaLC0p0jaQU6%2Fimage.png?alt=media\&token=3677bc2e-005e-4983-b79f-64e90e491772)

### 2.4 之后连续 N 日留存/流失

**之后连续 N 日留存用户数**指在某个时间发生了初始行为 X 的用户，在之后连续 N 日/周/月进行了后续行为 Y 的用户（ X 可以等于 Y ）。

例如：

> 初始行为 = 点击购买
>
> 后续行为 = 点击购买
>
> 4月1日发生购买的用户200人，这200人中4月2日再次购买的用户有100人，4月3日再次购买的用户有50人，4月4日没有人购买，4月5日有50人再次购买
>
> 则之后连续1日后留存用户为100，2日后留存用户为50，3日、4日都为0。

**之后连续 N 日流失用户数**指在某个时间发生了初始行为X的用户，在之后的连续 N 日/周/月没有进行后续行为 Y 的用户（ X 可以等于 Y ）。

例如：

> 初始行为 = 点击购买
>
> 后续行为 = 点击购买
>
> 4月1日发生购买的用户200人，这200人中4月2日没有购买的用户有100人，4月3日都发生了购买，4月4日没有购买的用户有50人，
>
> 则之后连续1日流失用户为100，2日、3日都为0。

![](https://2207941107-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LaKVSdcX30MGZ24jKF_%2F-MHu8Hdl0TJe9LgqtAfR%2F-MHuYPaQBRzfhB5UNe9I%2Fimage.png?alt=media\&token=98045004-ef80-48ca-911a-a38ea362e11a)

### 2.5 留存曲线

留存曲线用来表现【目标用户】的回访比例按照天数衰减的趋势。

对于常见的留存曲线，可以将其分为三个部分：第一部分是振荡期，第二部分是选择期，第三部分是平稳期。

![](https://2207941107-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LaKVSdcX30MGZ24jKF_%2F-MLqFBGNUwAF4Lu73UBE%2F-MLqGDOmDUMHWPDdlXXE%2Fimage.png?alt=media\&token=f92b0d64-a81a-429e-92f7-f8c4e9e6fa16)

对于不同时期，我们应该有不同策略，总的来说，在振荡期和选择期，我们应该关注新用户的留存，进入平稳期以后，着重关注产品功能的留存。

![](https://2207941107-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LaKVSdcX30MGZ24jKF_%2F-MHu8Hdl0TJe9LgqtAfR%2F-MHuYb0cfmDKUaBpS00l%2Fimage.png?alt=media\&token=eb627d99-2eea-46c7-9b27-f90340411c81)

方舟留存曲线展示的是留存表格中的第一行的概括

* 留存用户是已发生日期的累加值
* 留存率是当前列每个数据与初始行为用户数的加权平均数

合计列第N日的留存的计算逻辑为：每一日的第N日留存的留存用户的算术累加和/剔除未发生日期的目标用户数的算术累加和。

例如：当前日期为0923，查询过去7日(0916-0922)的留存。以合计列的第4日留存的计算逻辑举例：已知0920的第4日为0924，从0920开始往后的日期的第4日都是未来时间，未来日期不会有回访行为，因此计算合计列的第3日留存计算公式为：留存率=0.83%=(6+76+65+4)/(6180+5732+5497+800)

![](https://2207941107-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LaKVSdcX30MGZ24jKF_%2F-MHu8Hdl0TJe9LgqtAfR%2F-MHufqhqIUCIi16D5uPN%2Fimage.png?alt=media\&token=a0ac2fd6-0aa3-4f25-99a1-30a111da4e69)

###

### 2.4 人群下钻分析

所有图表中的数据节点，都可以下钻查看人群概览以及保存人群。

下钻人群下钻功能与分群一致，可在[分群](https://arkdocs.analysys.cn/features/user)中作进一步了解。

## 3. FAQ

### **3.1 初始行为和后续行为选择相同事件，当日留存率为什么不是100%**

当日留存的规则是：用户在触发了初始行为的当日触发了后续行为，不考虑初始行为和后续行为的发生顺序。但是用户触发的1次行为，不能同时作为初始行为和后续行为，因此初始行为和后续行为选择相同事件时，当日触发次数必须大于等于2次才会被计为当日留存。

{% hint style="info" %}
以上内容没有解答我的问题？[点击我来反馈](https://support.qq.com/products/118522/) 🚀
{% endhint %}
