答题产品数据体系分析 - 第一轮

答题产品数据体系分析 - 第一轮

关于产品数据分析的方法,大部分理论来自于Growthiohttps://www.growingio.com/school,他们分享的文章超级好,推荐大家都去看看,不光有方法论,还介绍了实际操作中常用到的方法、维度、图表等干货。我的这篇博客也并不是方法论的介绍,而是我对于答题产品数据体系的初步理解和建议(基于答妹),如果下周有时间的话我会在归纳一下方法论。

为了控制篇幅长度,具体需要获取的数据和需要分析的指标以及他们需要的图表,我都画在mindmaster里面的,大家下载一下就可以查看了,地址是:(http://pm.haxibiao.com:8080/browse/DM-390

前言

针对产品的数据分析,应该以业务场景作为思考的起始点,以业务决策作为分析的终点。数据分析不是一套一成不变的教条,哪些数据需要分析、怎么分析,必须要和当前产品的业务主要需求紧密相关,并随着主要需求的改变而转变;数据分析最终的目的,是发现问题、辅助业务决策和评估新方案效果

 

产品数据分析基本框架

1. 首先需要回答业务目标是什么,然后再开展数据收集和整理工作。业务是近期产品亟需优化的服务、功能,也是产品长期的北极星指标。

2. 明确近远期业务目标后,需要归纳关键事件并且设定关键指标。关键事件是我们在促成业务目标的过程中,观察到用户大概率可能发生的行为,或者要求用户必须发生的行为;关键指标则是对于这些行为的记录和整理。

3. 确认关键指标后,需要从不同维度对指标进行多维度分析。多维度分析的目的是细化用户和数据特征,让数据结果更加精准;他要求从不同的维度,利用不同的方法对数据进行分析。(多维度分析的意思是可以通过特定维度数据筛选关键指标)

4. 多维度分析后,需要根据特定的数据,给出自己的推测。通过数据分析,回答事件为什么会发生,问题为什么会产生。

5. 最后需要给出解决方案、做出数据决策,并且循环上述过程评估方案效果。通过对于方案的评价指标的追踪,回答如何优化产品以及如何避免这种问题。

本篇文章主要是数据分析体系的建设方案,不牵扯到具体的数据分析,所以45条内容暂时缺失(但是文章中会对部分可能出现的结果做出一些预测)

产品数据分析基本框架

业务目标

在和杨柳讨论之后,我们认为答题产品近期的目标是增加收入和降低支出。确切的说,第一,稳定并且提升eCPM增加收入;第二,降低老用户维持成本和挖掘老用户用户价值降低支出。而长期目标则是在有利可图的前提下,保证用户留存和日活的持续增长。

由于新、老用户这个维度对于广告收入和成本控制影响都很大,所以在具体开始分析之前,我们需要先给出新、老用户的界定标准。

对于答妹来说,定义如下(仅在统计时使用):

新用户:用户历史成功提现次数小于等于7

老用户:用户历史成功提现次数大于7

备注:用户累计提现次数达到8次时,用户会在次日被定义为老用户,避免当日数据出现混乱。

优点:提现是我们的核心流程之一,用户在目前版本的答妹想要获得提现的机会,既要刷激励视频,也需要答题看视频赚贡献点。

缺点:轻网赚用户在统计时会长期被永远归类在新用户分类,需要通过其他数据判断“内容+轻网赚”用户的数量;统计指标和实际新老用户分类指标有一定的偏离。

备选方案

用户注册时间

缺点:中小学生用户周末注册后,可能得等下周末才能再次上线;造成虽然是新用户,但被划分为老用户的结果。

用户历史活跃天数

优点:用活跃来判断非常准确

缺点:活跃这个属性本身不好界定

用户获得的历史贡献点

缺点:后续如果调整贡献点获得规则和兑换规则,定义就被改变了

用户获得的历史智慧点

缺点:后续如果调整智慧点的获得规则和兑换规则,定义就被改变;另外还有数量级问题,比如答题用户和激励视频用户获得的智慧点不是一个数量级的。

成功提现金额

缺点:新用户运气好的话马上会被归类为老用户,不能代表用户已经熟知产品,同时容易造成数据不准确;另外答题用户会被永远归在新用户分类

查看激励视频次数

优点:激励视频一直都是我们最主要的收入来源,也是目前答妹提现的主要限制因素

缺点:由于指标包含人均广告展示次数,如果以此界定新老用户的话,该数据会出问题。比如说我们鼓励新用户看激励视频,但他看再多的激励视频,不体验其他功能的话还是新用户。

eCPM

关键事件&关键指标

eCPM受到六个因素的影响:广告展示量级、广告人均展示次数、广告渗透率、新增用户占比、广告转化率、头部广告主&季节性影响。

通过内外因分析方法可知,而头部广告主&季节性影响属于外部不可控因素,而广告展示量级短期内无法有质变。所以我们在短期内能够施加影响的可操作指标只有四个,即人均展示次数、渗透率、新用户占比、转化率。

特定类型广告所对应的关键事件(用户行为)有所不同,另外新老用户对于eCPM的影响也不同,所以我们需要引入多维度分析,针对几类目前对于收入影响较大的广告进行一些数据的采集和分析。

多维度分析

对于答题类产品来说,我们的广告收益主要来自于以下四类广告:激励视频、全屏视频、信息流、draw视频

指标与维度

特定广告展示次数&转化率&CPM(必要:新老用户;可选:用户模型

新老用户特定广告人均展示次数(必要:广告入口;可选:app版本、用户来源、用户模型

新老用户特定广告渗透率(可选:用户来源、用户模型

新老用户特定广告入口(可选:用户模型

特定广告转化率(必要:新老用户、用户模型

支撑关键指标的数据

基础数据:日活、新用户日活、老用户日活

可选数据:用户模型、app版本、用户来源

广告数据:特定广告展示次数、特定广告当日CPM、特定广告入口、特定广告展示次数、特定广告转化率(以上所有数据都需要满足一定的维度数据条件)

分析目标

对于eCPM上述四个关键指标的长期追踪,最终目标是形成我们自己对广告联盟eCPM变化规律的预测,从而做到看到数据就能大致预测未来eCPM的发展,并且能够有相应的应对方案。


老用户维持成本和挖掘老用户用户价值

老用户的价值主要在于自传播,从数据分析的角度来说就是K因子,即一个老用户能带来多少个新用户。

老用户的维持成本受到两个因素的影响:老用户对eCPM的影响和老用户提现额。其中对eCPM的影响可以通过上文数据进行追踪,这一章主要考虑老用户提现额。

老用户提现是一系列关键事件的结果。具体来说,老用户需要在答妹内发生如下事件,才能完成提现行为:【答10道题获得提现资格】 =【检查余额和智慧点是否满足提现要求】,满足则【直接提现】,不满足则【获取智慧点或贡献点】

上述关键事件,也是我们需要监控的指标,和我们目前能够控制、调整的环节(答赚的情况和答妹稍微有些区别,需要和杨柳讨论之后才能决定

关键事件&关键指标

确定关键事件

老用户提现是一系列关键事件的结果。具体来说,老用户需要在产品内发生如下事件,才能完成提现行为:【答10道题获得提现资格】 =》 【检查余额和智慧点是否满足提现要求】,满足则【直接提现】,不满足则【获取智慧点或贡献点】。

在具体分析之前,我们需要将用户行为抽象,以便于更好的理解归纳他们的行为,为之后的决策做准备

  • 【答10道题获得提现资格】就是当日提现的【前置条件】。
  • 【检查余额和智慧点是否满足提现要求】是由用户的【认知】、【偏好】(需要用户模型和相应的数据分析)和【兑换规则】共同决定的
  • 【直接提现】或是【获取智慧点&贡献点】是由用户【偏好】和【代币获取规则】共同决定的

他们具体的定义如下:

  • 【用户的认知和偏好】:上一篇博客详细说明了认知和偏好是什么。
  • 【前置条件】:不能积累的,每日都需要满足才有可能发生提现行为
  • 【代币获取规则】:可以积累的,用以兑换现金的代币。
  • 【兑换规则】:包含“兑换比例”、“提现数额”、“提现方式”等规则

我们可以调控的是【前置条件】、【代币获取规则】、【兑换规则】;同时我们需要通过老用户的行为,了解他们的认知和偏好,建立【用户模型】,预估各类型老用户的占比,才能做到精细分析和精细调控。

确定关键指标

假设对我们最为有利的用户结构比例如下:5成的不提现或少提现留存(内容消费,提现次数小于活跃天数的一半),3成的提现但准备流失的老用户,2成的稳定提现留存和零星刷子(数字是乱写的,感受一下意思就行)

那么针对现存老用户,我们现阶段的具体目标清除刷子,维持小比例的提现老用户保证日活,较高比例的少提现留存老用户。结合答妹的实际日活和规则,我们暂时仅考虑余额和贡献点充足的情况下,老用户会具体发生哪些行为

  1. 上线回答10个题目,完成提现,尽量获取最多的贡献点和余额
  2. 上线回答10个题目,完成提现,获取一定量的贡献点和余额
  3. 上线回答10个题目,完成提现

刷子长期来看,应该会稳定出现情况一;提现老用户长期来看应该会稳定出现情况二;少提现老用户长期来看应该会稳定出现情况三。

所以关键指标可以是【老用户提现周频率】、【老用户贡献点获取量】、【老用户余额比例】、【当日回答10道题的用户与当日提现用户差值

多维度分析

前置条件

前置行为并非一个特异性指标,因为所有用户都会完成该行为。不过我们可以用完成提现前置条件人数和提现成功的差值,去发现那些达到了完成了前置要求,达到了提现标准但没有提现的用户,从而确定不同类型用户的比例;另外,该数据也可以配合行为轨迹分析,了解我们的提现流程是否出了问题。

对于答妹来说,该指标为【当日回答10道题的用户 - 当日提现用户】,并且可以加入分类筛选条件,即满足提现兑换规则用户所占的比例。

代币获取规则

答妹目前获取贡献点的方式只有三个:签到(718贡献;3020贡献)、激励视频、draw视频。首先这是不合理的,因为非熟练网赚用户想要获得第二日提现,必须要刷18次激励视频,非常劝退轻网赚用户,但为啥我没有提出其他方案呢,主要是因为没想好。

代币获取规则是非常重要的调控手段,主要可以通过不同代币获取入口获得的代币量来反映。具体到答妹来说,就是【新老用户每日平均通过三种方式获得多少贡献点】。(不能简单的用获得贡献点平均值来追踪代币获取规则,因为部分用户可能不在产品内发生行为。另外不同贡献点获取方式对于用户模型建立也非常重要

上述数据的作用是帮助我们设置代币获取规则,假设新用户每日查看激励视频次数大于2次的如果占50%的话,那么合理的新用户激励视频展现量就应该是2次上下,我们可以通过其他方式给予用户贡献点,例如全屏视频或者信息流。

代币兑换规则

对于答妹来说,阻碍用户提现的主要是贡献点。目前答妹新老用户兑换每日基础提现的贡献点消耗是相同的,但获得的金额不同。

代币兑换规则的数据是一个滞后指标,我们需要监测的数据是规则改变后,用户有什么反应。

代币兑换规则是我们能够调控的一个非常强力的指标,既我们控制老用户收入最重要的来源,也对留存有重要影响。所以我们必须要对代币兑换规则调控后可能影响的数据进行记录。由于目前新老用户的兑换规则不同,所以分析必须区分新老用户。

另外考虑历史遗留问题,部分老用户手上存了很多余额贡献点,我们在建立衰减机制之前,需要了解这部分老用户的数量,近期行为等数据。

指标与维度

每周老用户提现频率(可选:用户是否满足提现要求、用户日代币获取量、用户模型

新、老用户日贡献点获取量可选:用户模型、时间、方差)

老用户日提现资格比例可选:用户每日获得贡献点、用户每日获得智慧点、用户模型、时间

老用户k因子变化(可选:用户模型)


支撑关键指标的数据

基础数据:日活、新用户日活、老用户日活

可选数据:用户模型、用户是否满足提现要求、用户满足前置条件但未提现、用户每日获取贡献点、用户每日获取智慧点

分析目标

老用户维持成本和价值挖掘,需要结合成本计算进行长期追踪,我们必须要知道老用户的比例,可能的成本,新方案可能导致的用户比例以及改版之后的成本等内容。核心目标是将老用户成本长期稳定在某个值,并且能够持续压低。希望通过数据体系能够估算改动方案会导致的成本变化,并且找到合适的成本调节方法。

最终目标是将用户的总获取成本,压低到产品收益的1/3,甚至更低。(在growthio上看到的数字,不知道是为啥,但是感觉也差不多)

另外由于答赚和答妹是同属性产品,他们之间的数据有相互参考对比的意义的。例如目前答妹的全屏视频展现量从比例上要比答赚低非常多,那么全屏视频可能是答妹增加收入的机会。

还有老用户有部分余额特别多的情况,在数据出来之后可以着手处理一下。

激活&留存

我们需要先引入与激活和留存相关的两个概念。

激活:Aha moment并不只是单纯的定性说法,定量的Aha moment定义如下:【谁】在【多长时间内】完成【多少次】【某种行为】

留存:留存曲线一般可以分为三段:震荡期、选择期和平稳期。(时间是我假设的)

  • 震荡期:震荡期的特点就是用户留存变化的非常剧烈,对于答妹来说,我认为震荡期主要集中在前3日,我们会损失大约90%-95%的用户。
  • 选择期:选择期的特点是用户对产品有了初步了解,他开始判断产品有没有满足核心需求。如果能满足,用户会选择留存;如果没有满足,那用户会流失。对答妹来说可能是4-7日。
  • 平稳期:就是老用户了

根据上述概念,我们将用户的激活和留存分为三个阶段:激活、激活&留存、留存。

激活

用户激活是一个连续的过程,对于答题类产品来说,我们主要考察新手引导开始到成功提现新人红包这一过程;它可以通过一个页面漏斗进行分析和优化。而最终的激活指标可以设置为新用户提现行为。还可以补充设置一个用户当日回答题目数量超过30题的指标,这是为了避免将非网赚用户排除在外。

漏斗指标如下图所示,需要记录每个步骤用户剩余的百分比

新人引导简易版.png

激活&留存

在用户完成新人引导不代表他就被成功激活了,激活成功的标志是用户进入了选择期,即对产品有了相对完整的认识。所以我们需要持续跟踪用户在震荡期的行为,以用户模型中的筛选条件作为指标,找到和用户留存正相关性最强的行为,然后通过对行为的归纳,建立属于我们的用户模型。

留存

留存有两种常用的分析方法,一种是以时间为维度的分析方法,另一种是以用户行为为维度的分析方法(通过不同维度和相同维度不同数量的筛选,进行精细化分析)。

image.png

时间维度:

image.png

加入筛选条件(需要对单个用户行为进行记录)

image.png

行为维度(需要对单个用户行为进行记录)

image.png

除了上述两种分析方法外? 不同阶段用户的喜好也是不同的。以答妹举例,选择期的用户可能普遍觉得每日提现额度太少了,但是稳定期的用户肯定认为稳定提现很棒。所以在决定决策方案的时候,我们可以逆向思考,假设有一个不提现天天答题看广告的老用户,我们可以查看他的历史行为,了解他在震荡期和选择期喜欢在app内干什么事情。

指标和需要获取的数据都在mindmaster文件内,因为牵扯到非常多的行为,写到文章里的话会导致篇幅太长。

分析目标

找到ahamoment的关键时间和用户流失的关键节点,增加用户的留存率。

找到对我们有利的关键行为,在产品内鼓励该行为的发生。

异常监控

多亏了达威的超强行动力,我们上线异常监控啦。有了新工具,具体的异常监控可以部分独立于数据体系存在,而数据体系中的异常监控可以仅仅作为一个较为粗略的先导指标。具体来说有以下四点:

  • 单个用户不同入口每日获得智慧点
  • 单个用户不同入口每日新增余额
  • 单个用户不同入口每日获得贡献点
  • 不同入口每日广告展现量

用户细察(行为轨迹)

数据不能反映某个用户在产品内的具体行为,导致我们没有办法将用户模型细化,既没有办法快速追踪到特定的异常用户,也没有办法追踪到特定的值得行为优良用户。所以我们还需要补充一个【用户细察】。

用户细察就是用户行为轨迹,实际上matomo目前就有相关的功能,但是matomo上的数据有两个问题

  • 和用户id不关联
  • 部分行为没有被记录或者记录不准确

总结

第一次尝试写一个完整的数据分析方案,肯定有很多的不足之处,希望大家多多指正。

文章比想象中的要长,并且有些部分比较难读,废话比较多。主要原因是产品数据牵扯到的范围比较广,再加上是尝试将新方法和流程运用到我们的产品上去,所以希望尽量把思考过程写清楚。

最后附上所有需要采集的数据,和分析的指标脑图(看不清的话最上头有链接)

答题产品数据体系_V1.png

思齐思齐

如果觉得我的文章对您有用,请随意赞赏。您的支持将鼓励我继续创作!

赞赏支持
被以下专题收入,发现更多相似内容