归因分析计算因子贡献度常见的方法

您所在的位置:网站首页 影响因子怎么确定 归因分析计算因子贡献度常见的方法

归因分析计算因子贡献度常见的方法

2024-06-22 13:18| 来源: 网络整理| 查看: 265

在归因分析中,我们一般都需要计算出每个因子的贡献度是多少,比如产品DAU上升,对年龄段维度进行拆解,看是不同年龄段的用户对DAU上升的贡献度是多少,一般根据指标的类型,计算贡献度的方法也不一样,下面就列出一些常见的归因分析贡献度的计算方法。

目录

1、指标类型

2、贡献度计算

2.1、替代法:A/B或者A*B*C类型指标

2.1.1、连环替代法

2.1.2、控制替代法

2.2、加法-直接拆解:M=A+B+C

2.3、乘法-log转化:M=A*B*C

2.4、超均贡献计算法:原子指标

2.5、加法-加权占比法:M=A+B+C(纵向对比,分解维度)

2.6、综合贡献计算法:均值指标,A/B指标

2.7、mdrca法:Multi-Dimensional Root Cause Analysis

1、指标类型

指标类型一般可以直接分为两类,原子指标和复合指标,原子指标就是DAU、GMV这种单值,不依赖其他变量独立统计的指标。复合指标是在原子指标上进行数学计算加工,需要通过两个或多个变量做除法计算的指标,比如购买率=购买人数/浏览商品人数。

2、贡献度计算 2.1、替代法:A/B或者A*B*C类型指标 2.1.1、连环替代法

公式定义:

假设核心经营指标及计算公式为:M = a * b *c, 对比周期指标值为 M1 = a1 * b1 * c1,本期指标值为 M2 = a2 * b2 * c2;本期对比上期的偏移量为 M2 - M1 确定先后替换顺序为:a、b、c,找出最大的核心指标影响因子 先替换a,得到Ma = a2 * b1 * c1,那么因子a对核心指标的影响为 Ha = Ma - M1 再替换b,得到Mb = a2 * b2 * c1,那么因子b对核心指标的影响为 Hb = Mb - Ma 再替换c,得到Mc = a2 * b2 * c2,那么因子c对核心指标的影响为 Hc = Mc - Mb 比较影响因子a、b、c对核心指标的影响值Ha、Hb、Hc的大小,其中各因子的差异值之和等于核心指标差异值(Ha + Hb + Hc = M2 - M1),从而找到影响核心指标最大的因素。 进一步Ha / (M2 - M1)可以表示a指标带来的影响比例大小。跟预期相比,M2 - M1这么大差额由于a指标降低(提升)的影响,对实际总指标M造成了Ha大小的损失(提高)

优势&局限性: 优势:通过上面的拆解可以发现,该方法满足所有下级指标的波动之和等于核心指标的波动,使得波动可以用瀑布图完美呈现。 局限: ● 贡献值的大小与替换顺序强相关,甚至会因为替换顺序的改变影响贡献值的排序结果;虽然理论上可以通过数量指标-质量指标-价值指标的顺序来尽量保证结果的可靠性,但对于大部分产品用户而言并不一定清楚了解内在逻辑并如此配置,会导致结论严谨性受损。 ● 无法保证下级指标的贡献度在[-100%,100%]的范围,业务解释性较差

2.1.2、控制替代法

公式定义

控制其他指标不变,替换a指标,得到Ma = a2*b1*c1,那么因子a对核心指标的影响为 Ha = Ma - M1 控制其他指标不变,替换b指标,得到Mb = a1*b2*c1,那么因子b对核心指标的影响为 Hb = Mb - M1 控制其他指标不变,替换c指标,得到Mc = a1*b1*c2,那么因子c对核心指标的影响为 Hc = Mc - M1

a指标的贡献度可以计算为:Contri_a = Ha/|Ha|+|Hb|+|Hc| b指标的贡献度可以计算为:Contri_b = Hb/|Ha|+|Hb|+|Hc| c指标的贡献度可以计算为:Contri_c = Hc/|Ha|+|Hb|+|Hc|

优势&局限性: ● 替换顺序的影响被消除,无论先替换哪个指标,因子贡献值的组合唯一。 ● 每个因子的贡献值均落在[-100%,100%]的范围,业务解释性更强。 ● 无法保证各指标影响之和为指标本身偏差。

2.2、加法-直接拆解:M=A+B+C

公式定义

1、基期N=A+B+C,本期N'=A'+B'+C',差额=N'-N 2、计算不同因素单独变动带来的影响数:如A因素带来的变动Na=A'-A 3、总变动=N'-N=Na+Nb+Nc 4、确定每个因素的影响占比:Contri_a = Na/(N'-N);Contri_b=Nb/(N'-N);Contri_c = Nc/(N'-N)

GMV异动诊断 

总GMV

商品1

商品2

当前 (A)

20000

10000

10000

基期 (B)

18000

9500

8500

DIFF(A-B)

2000

500

1500

贡献度

/

25%

75%

2.3、乘法-log转化:M=A*B*C

公式定义:

1、基期N=A*B*C,本期N'=A'*B'*C',其中N'=N(1+n),A'=A(1+a),B'=B(1+b),C'=C(1+c)

2、对N'=A'*B'*C'取对数可得\Rightarrow logN+log(1+n)=logA+log(1+a)+logB+log(1+b)+logC+log(1+c)

3、因为logN=logA+logB+logC,所以上述公式抵消后可得:log(1+n)=log(1+a)+log(1+b)+log(1+c)

4、

推导确定每个因素影响占比:Contri_a =log(1+a)/log(1+n)Contri_b =log(1+b)/log(1+n)

Contri_c =log(1+c)/log(1+n)

2.4、超均贡献计算法:原子指标

超均贡献度的提出是为解决原子指标单看变化的绝对量级(偏移量、偏移量占比)和变化的相对快慢(波动率)导致的不准确问题:

用变化的绝对量级进行根因定位:会导致量级较大的维度因子长期排在前列,可能无法识别非头部因子带来的影响。

用变化的相对快慢进行根因定位:会导致量级较小但波动剧烈的因子排在前列,忽略了量级影响。

超均贡献度提供了一个综合变化量和波动率的量化依据,用于衡量维度因子对指标整体波动的贡献占比,较单独查看波动率和偏移量数值而言,综合两方面因素更为科学准确。

贡献度详细解释如下:

当前按超均法判断超过指标大盘的因子: (1)计算超均贡献值=(因子波动率-指标波动率)* 因子本期值 (2)因子贡献度 = 因子贡献值/维度下所有因子贡献值绝对值之和 即将维度下所有因子的贡献值,进行归一化,量化为100%以下的百分数,作为贡献度

举个例子:

1、超均贡献值:I_i = (F_i - F_7)*(B_i), i = 2,3,..6

2、超均贡献度:J_i = I_i / SUM(ABS(I_i)), i = 2,3,..6

超均贡献度的解释性

超均贡献度可以理解为“因子波动与指标值(均值)波动差异的相对大小”,超均贡献度越大,说明因子的变化偏离均值变化越大,越有可能是根因。

指标波动有上升或下降,因此贡献度也有正和负之分,全部维度因子贡献度加总约为0%。在查看原因时,更关注与指标值同向变化的维度因子。

当指标波动上涨时,例如指标波动率为 +20%,正向贡献较大的因子将会排在头部,如TOP1影响因子很可能为贡献度>30%的某因子。

当指标波动下降时,例如指标波动率为 -20%,负向贡献较大的因子将会排在头部,如TOP1维度因子很可能为贡献度



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3