归因分析计算因子贡献度常见的方法

您所在的位置：网站首页 › 影响因子怎么确定 › 归因分析计算因子贡献度常见的方法

归因分析计算因子贡献度常见的方法

2024-06-22 13:18| 来源: 网络整理| 查看: 265

在归因分析中，我们一般都需要计算出每个因子的贡献度是多少，比如产品DAU上升，对年龄段维度进行拆解，看是不同年龄段的用户对DAU上升的贡献度是多少，一般根据指标的类型，计算贡献度的方法也不一样，下面就列出一些常见的归因分析贡献度的计算方法。

1、指标类型

2、贡献度计算

2.1、替代法：A/B或者A*B*C类型指标

2.1.1、连环替代法

2.1.2、控制替代法

2.2、加法-直接拆解：M=A+B+C

2.3、乘法-log转化：M=A*B*C

2.4、超均贡献计算法：原子指标

2.5、加法-加权占比法：M=A+B+C（纵向对比，分解维度）

2.6、综合贡献计算法：均值指标，A/B指标

2.7、mdrca法：Multi-Dimensional Root Cause Analysis

1、指标类型

指标类型一般可以直接分为两类，原子指标和复合指标，原子指标就是DAU、GMV这种单值，不依赖其他变量独立统计的指标。复合指标是在原子指标上进行数学计算加工，需要通过两个或多个变量做除法计算的指标，比如购买率=购买人数/浏览商品人数。

2、贡献度计算 2.1、替代法：A/B或者A*B*C类型指标 2.1.1、连环替代法

公式定义：

假设核心经营指标及计算公式为：M = a * b *c，对比周期指标值为 M1 = a1 * b1 * c1，本期指标值为 M2 = a2 * b2 * c2；本期对比上期的偏移量为 M2 - M1 确定先后替换顺序为：a、b、c，找出最大的核心指标影响因子先替换a，得到Ma = a2 * b1 * c1，那么因子a对核心指标的影响为 Ha = Ma - M1 再替换b，得到Mb = a2 * b2 * c1，那么因子b对核心指标的影响为 Hb = Mb - Ma 再替换c，得到Mc = a2 * b2 * c2，那么因子c对核心指标的影响为 Hc = Mc - Mb 比较影响因子a、b、c对核心指标的影响值Ha、Hb、Hc的大小，其中各因子的差异值之和等于核心指标差异值（Ha + Hb + Hc = M2 - M1），从而找到影响核心指标最大的因素。进一步Ha / (M2 - M1)可以表示a指标带来的影响比例大小。跟预期相比，M2 - M1这么大差额由于a指标降低（提升）的影响，对实际总指标M造成了Ha大小的损失（提高）

优势&局限性：优势：通过上面的拆解可以发现，该方法满足所有下级指标的波动之和等于核心指标的波动，使得波动可以用瀑布图完美呈现。局限： ● 贡献值的大小与替换顺序强相关，甚至会因为替换顺序的改变影响贡献值的排序结果；虽然理论上可以通过数量指标-质量指标-价值指标的顺序来尽量保证结果的可靠性，但对于大部分产品用户而言并不一定清楚了解内在逻辑并如此配置，会导致结论严谨性受损。 ● 无法保证下级指标的贡献度在[-100%,100%]的范围，业务解释性较差

2.1.2、控制替代法

公式定义

控制其他指标不变，替换a指标，得到Ma = a2*b1*c1，那么因子a对核心指标的影响为 Ha = Ma - M1 控制其他指标不变，替换b指标，得到Mb = a1*b2*c1，那么因子b对核心指标的影响为 Hb = Mb - M1 控制其他指标不变，替换c指标，得到Mc = a1*b1*c2，那么因子c对核心指标的影响为 Hc = Mc - M1

a指标的贡献度可以计算为：Contri_a = Ha/|Ha|+|Hb|+|Hc| b指标的贡献度可以计算为：Contri_b = Hb/|Ha|+|Hb|+|Hc| c指标的贡献度可以计算为：Contri_c = Hc/|Ha|+|Hb|+|Hc|

优势&局限性： ● 替换顺序的影响被消除，无论先替换哪个指标，因子贡献值的组合唯一。 ● 每个因子的贡献值均落在[-100%,100%]的范围，业务解释性更强。 ● 无法保证各指标影响之和为指标本身偏差。

2.2、加法-直接拆解：M=A+B+C

公式定义

1、基期 $N=A+B+C$ ，本期 $N'=A'+B'+C'$ ，差额= $N'-N$ 2、计算不同因素单独变动带来的影响数：如 $A$ 因素带来的变动 $Na=A'-A$ 3、总变动 $=N'-N=Na+Nb+Nc$ 4、确定每个因素的影响占比： $Contri_a = Na/(N'-N);Contri_b=Nb/(N'-N);Contri_c = Nc/(N'-N)$