首页 > 技术文章 > 数据分析中的常用“公式”

dataxon 2020-03-19 11:59 原文

虽然文章标题中含有“公式”,但本文侧重于——从公式的角度看数据分析的思维方式。

1. X->Y
此处用来表示自变量X和因变量Y的关系(严格来说,这个算不上一个公式),公众号的老朋友们应该会发现我在很多文章中都会参考这个公式的框架。描述、解释、预测是数据分析常见的3种场景:
  • 描述,可以理解为用指标来对业务进行展示的过程,比如报表开发、指标体系等,这个过程好比要用一个量化的指标来衡量Y(比如KPI),然后再分析组成Y需要有哪些成分X;
  • 解释,常见的业务场景是对指标的波动或者差异归因,此时的逻辑则是从ΔY中发现ΔX,更多可以参考归因的方法
  • 预测,对应业务场景是预估某个数值,即通过已知的X来计算得到未知的Y,更多可参考预测的方法
X->Y 下最常见的两种公式则是“加权求和”和“连乘”。

1.1 加权求和
该公式表示整体和局部的关系,既可以用于对某个指标的拆解,也可以类似用AHP方法来合成一个新的综合指标。e.g. 某业务总体的下单率为R,假设有3个细分业务,各业务的入口流量占比为a, b, c,各自的下单率为ra,rb,rc,那么R = a*ra+b*rb+c*rc,经过这样拆分后我们可能会发现不同业务的下单率可能不一样,那么要提升整体的下单率R,方法之一,可以参考“糖水不等式”,将入口流量更多倾斜到高下单率的细分业务。

e.g. 客单价 =,这里c表示商品i的数量,p表示商品i的价格,那么要提升客单价可以参考这个公式,可以调整商品价格、提升单品销售量、扩充商品品类等。

 

1.2 连乘公式
通常用于带有“转化率”的场景,比如电商交易是典型的“鱼骨图”或者“漏斗”模式。
连乘公式可以用于业务环节的拆分,也可以和“加权求和”公式混合使用。
e.g. GMV = 访客数*下单转化率*支付成功率*出仓转化率*客单价
e.g. 活动实际参与人数 = 目标用户数*活跃率*领取率*可用率*使用率
如果要提升等式左侧的关键指标,那么增大连乘公式中的系数之一即可。

2. 糖水不等式
该公式的启示是,可以将业务整体划分为“高”(糖)、“低”(水)两部分,也可将糖理解为分母,水理解成分子(主要成分),整体的指标好比糖水的浓度,提升浓度则需要增加“糖”或者减少“水”。

e.g. 前面提到了增大表现好的业务的资源占比,可以提升总体表现;

e.g. 用户整体质量的提升,那么可以加更多的糖,让高质量的用户(糖)相对地低质量用户(水)更多地增加;

 

3. “成本-收益”公式
利润 = 收益-成本
e.g. 俞军的“产品价值公式”——产品价值=(新体验-旧体验)-换用成本
进行决策或方案对比时,不仅要看是否能产生“利润”,通常也会看投入产出比(ROI)。
此外,ΔROI同样重要。举个例子,60分的付出可能有60分的回报,但是80分的付出可能只有70分的回报——付出(cost)和回报(gain)之间常会出现边际效用递减现象。如果有另一件事情可以用20分的付出产出超过10分的回报(假设回报是等价、可累加的),那么就应该做另一件事。

 

 


以上,就写这些,欢迎交流。
 

推荐阅读