常言道,做事情讲究一个章法,数据分析也是如此,做数据分析要有章法要有框架。我们可能已经见过或用过很多 数据分析方法 了,比如对比分析、趋势分析、漏斗分析等,但这些 数据分析方法 在我们脑海里可能是零散的,尚未有机地组合在一起形成我们的知识图谱,有鉴于此,本文就梳理总结下数据分析中的思维模式及实操方法 ,以便我自己和大家熟读生巧。

我们先定下归类标准,我们将数据分析拆成思维模式和实操方法这2个层面来说,对于思维模式来说,主要倾向于思维层面的,不仅可以应用于数据分析这个岗位,也可以应用于其他岗位,对于实操方法来说,主要是数据分析具体实操方面的。在此归类标准下,我们对数据分析梳理出以下知识图谱:

下面我们就图中重点内容展开讲一下:

思维框架

· 金字塔结构化思维

金字塔结构化思维是一种用于思考问题、陈述表达的结构化的思维框架,在思考和陈述的过程中遵循<结论先行、以上统下、归纳分组、逻辑递进>的金字塔结构。在对问题进行逻辑分类时,无论是演绎还是归纳,都必须遵循MECE原则,即相互独立、完全穷尽的分类原则,将问题进行分解,每一层级的问题之间没有重复、交叉、相关性,就是“相互独立“,每一层级的问题务必列举完全、不出现遗漏,就是“完全穷尽”。


· 假设验证

假设验证是一种将问题具体化的思维方式,当我们遇到比较宽泛无从下手的问题时,我们可以遵循MECE原则,先假设出几个答案,然后再逐一验证。注意假设验证不是直接预设正确答案然后找证据支持,而是预设几个答案然后逐一验证是否正确。


· 5W2H分析法

5W2H是非常经典有用的思考框架,直接告诉了我们在处理问题时,应该从哪些角度去思考和入手,我们对着这些角度提出问题,并对应回答解决。


· 逻辑树分析法

逻辑树分析法是MECE原则和假设验证更具象化的分析解决问题的思考框架,逻辑树又称为问题树,顾名思义,就是将已知问题分解为多个子问题并分层罗列逐一分析。


· AIPL模型

AIPL模型明确了用户与我们的产品或服务关系深化的过程即 认知→兴趣→购买→忠诚 的过程,将原本难以量化的用户资产进行了量化,从而可进一步实现链路化运营。当我们在做用户运营或客群分层时,可以从AIPL路径来着手,定义并量化不同层级的客群,从而精细化运营。


· 用户生命周期

用户生命周期是指从与客户建立业务关系开始到完全终止关系的全过程,包括 引入期→成长期→成熟期→休眠期→流失期 。周期全过程不一定适应所有产品和服务,具体要看产品和服务的特性。当我们在做用户运营或客群分层时,可以从用户生命周期全过程来着手,定义并量化出不同阶段的客群,从而精细化运营。


· AARRR模型

AARRR模型是非常经典的用户增长模型,定义了实现业务增长的5个指标,即 获取→激活→留存→变现→自传播 。从大的角度来说,无论是新业务还是老业务,我们可以从这5个维度来思考我们的商业模式。从小的角度来说,在业务分析中,从指标体系的搭建到日常的数据分析,我们可以从这5个角度来着手。


· 人货场模型

人货场模型直接明确告诉我们从人、货、场这3个角度来思考和看待问题。从大的角度来说,当我们要开辟新业务或者上线新活动时,我们需要思考我们的目标用户是谁、我们要推的产品是什么、我们的渠道是什么。从小的角度来说,当我们在做数据分析时,脑子一片茫然时,我们可以基于人货场模型,分别从用户、产品、渠道这3个维度来开展分析。


· 4P营销理论

4P是指“产品、价格、渠道、促销”4大营销组合策略。从大的角度来说,企业需要在产品、价格、渠道、宣传推广这4个方面下功夫,提高产品力满足消费者需求、差异化定价策略、寻找合适的渠道、做好品牌宣传和产品促销。从小的角度来说,我们的一些数据分析课题可以基于这4个维度来展开。


· PDCA循环

PDCA循环是一套经典的项目管理的工作流程,包括 计划→执行→检查→改进 4个过程,它帮助我们更有章法得做事,我们的日常工作或重点项目都可以参考这套标准流程来推进。



实操方法

· 对比分析

我们在汇报时,不是汇报数据,而是汇报结论,单一孤立的数据其所含的价值很小,因为我们无法做出业务判断无法给出结论。我们需要进行对比分析,如与目标值的对比、时间趋势上的对比、不同分组的对比、不同策略效果的对比等,通过对比分析,我们能够判断对比目标间的好坏,从而给出结论和做出决策。对比分析包括横向对比和纵向对比,横向对比主要指对同一时间周期下不同主体的比较,如不同地区、不同客群、不同产品的对比,纵向对比主要指对同一主体不同时间周期下的比较,主要是环比和同比,如总销售额的环比同比、产品A的销量的环比同比。


· 趋势分析

趋势分析属于对比分析的时间上的纵向对比,我们不能只展示单一时间点的数据,需要同时展示历史数据。在时间坐标轴上展示一段时间内的所有数据,一是能判断当前时间点指标的好坏,二是能有利于发现指标变化的周期性规律。趋势分析中时间周期包括:时、日、周、月、季、年,我们可以按需选用。


· 细分分析

细分分析属于对比分析的横向对比,从大化小是细分分析的底层逻辑,对业务进行解构,从不同维度进行细分并对比,从而发现主次因素。细分分析在异常归因分析中非常有用,比如今天的总体销售额下降了,经过细分和对比,发现产品A和产品B都是正常的,但产品C的销售额明显下降,定位到产品C之后,再继续分析产品C。细分分析中常用的细分维度包括:用户、产品、渠道等,用户的细分维度包括:新老客、生命周期分层、性别年龄等。细分分析不一定每次都只对单一维度进行细分,也可以同时对多个维度进行细分,像交叉分析和RFM分层就是同时对2个维度和3个维度进行细分。


· 漏斗分析

漏斗分析属于细分分析的一种,一般来说,我们的业务流程都是分行为节点的,即便真的没有明显的行为节点,我们也可以人为划出节点,既然业务流程是一连串的行为节点,那我们就需要监控从起点到终点的整个流程,建立出整个业务流程的转化漏斗,一方面定位出漏损高的节点从而针对性优化,一方面监控业务健康度及时发现异常。漏斗分析不是简单做一个孤立的漏斗,要有对比才行,有对比才能说明漏损是正常的还是异常的,比如不同时间周期的漏斗对比、不同策略的漏斗对比等。


· 生命周期价值分析

业务目标是要盈利的,而客户是有生命周期的,从客户过来到客户流失,这中间就是我们能从客户身上获取商业价值的周期,在获客成本越来越高的情况下,我们愈发需要关注客户生命周期价值,我们需要测算客户生命周期价值LTV和获客成本CAC的关系,从而判断业务是否可持续以及如何实现更多盈利。


· 同期群分析

同期群分析属于细分分析的演变,顾名思义,就是按照同一时间周期来划分客群并观察其在数据表现上的差异。常见的留存分析留存曲线以及Vintage分析都属于同期群分析,比如按新客户的获客时间来划分客群,观察其在T+N周期上的变化趋势。我们还可以分渠道分产品分别做同期群分析,从而进一步发现业务差异。


· 矩阵分析

矩阵分析又称为象限分析,可以非常直观的评估不同主体间的差异,先选定2个指标,然后依据各个主体的指标值将它们划分到4个象限中,从而判断不同主体的好坏以及需要采取的措施。


· 迁移分析

既然有客户分层,那就有会客户迁移。客户在时间点A所属的分层和在时间点B所属的分层,很可能是不一样的,我们可以通过迁移矩阵来分析不同分层客群间的迁移分布、来源和去向,从而指导我们去做一些预测分析和异常分析。


· AB测试

AB测试已经成为互联网公司日常工作的标配工具,广告投放、产品迭代、营销策略等都会应用AB测试。AB测试是对比思想的具体应用,通过持续不断的AB测试,来持续不断的用更好的方案替换当前的方案,从而实现持续不断的优化。AB测试主要涉及不同方案的确定、效果指标的确定、对比分析、假设检验等内容,其中效果指标通常会看响应率、ROI、增量业绩等。


· 指标公式拆解

指标公式拆解,属于细分分析的一种,顾名思义,就是按照加减乘除的数学等式将指标拆分成不同的组成部分,从大化小,从而方便我们定位或分析。比如按流程的拆解,注册量 = 浏览量 × 点击率 × 下载率 × 注册率,按构成的拆解,总放款金额 = 首贷放款金额 + 复贷放款金额。


· FAST指标体系

FAST指标体系是阿里提出的三大营销模型之一,从数量和质量上衡量业务运营的健康度,搭建业务指标体系可以参考该模型框架。


· RFM客户价值分层

相信大家对RFM模型已经听过很多次了,RFM模型的核心是从R、F、M这3个维度来综合度量客户价值,对客户进行分层从而精细化运营。该模型为我们提供了3个维度,我们在做其他数据分析时,也可以参考这3个维度,比如结合R维度和F维度,我们可以将客户活跃度细分为高活跃、中活跃、低活跃、睡眠客户。另外有两点需要强调,一是,RFM客户价值分层是某个时点下的分层,因此最好结合迁移矩阵观察客户的迁移,二是,RFM客户价值分层是基于客户总体数据的,没有体现客户交易偏好的差异,因此实际应用中还要结合其他维度,比如不同产品类别下的客户价值分层或者只基于特定产品类别的数据进行客户价值分层。


· ABC分类分析

ABC分类分析又称帕累托分析,类似于二八法则,少数的产品或少数的用户贡献多数的业绩,ABC分类告诉我们应该更多关注畅销产品和头部用户,首先要保证畅销产品的持续改进以及做好头部用户的体验和服务,然后再考虑投入资源到新业务或者开发新客户中。具体到数据分析中,ABC分类分析主要是简单的统计分析,比如:按销售额排名后计算累计占比,然后按经验或者按数据情况划分ABC三类。


· TGI指数分析

TGI指数全称Target Group Index,反映目标群体在研究范围内的强弱势情况。TGI指数可以用来量化偏好或影响度,从而对比不同目标群体的偏好或者对比不同目标群体对总体的影响度。TGI指数的计算公式如下,需要强调的是,所有的比例型指标在应用时都要注意分子分母的数量级,否则容易对比得出错误的结论。以银行业务举个简单的例子,从TGI指数来看,要想扩大高资产客群,还需要在代发工资客户身上下功夫。

TGI指数=(目标群体中具有某一特征的群体所占比例/总体中具有相同特征的群体所占比例)*100


· 相关性分析

相关性分析在建模分析中应用的比较多,利用相关系数或者特征重要度筛选出对目标变量影响大的特征,从而集中精力在这些特征上去做更深入的分析。比较常见的应用是相关系数热力图,比如基于sklearn自带的波士顿房价数据集计算相关系数并绘制相关系数热力图如下。


以上算是数据分析的一个简单的知识图谱,基于笔者的工作经验,列举了常用的思维模式及实操方法。值得一提的是,其中每一点的内容都不止以上所描述的,还有很多细节需要深入学习并实践,如果你有兴趣,可以针对性学习。另外,这些思维模式和实操方法都不是孤立的,需要我们慢慢得融会贯通,一切为更好的分析服务,笔者也在不断实践中。


原创文章,转载请务必注明出处并留下原文链接。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注